La investigación del estudiante de doctorado Theosamuele Signor, titulado “A baseline on the relation between chemical patterns and birth stellar cluster”, ha sido aceptado para publicación. Este trabajo se enfoca en el uso de grandes conjuntos de datos y técnicas de aprendizaje automático para analizar la evolución de las galaxias. En colaboración con Inria, instituto francés de investigación en ciencias y tecnologías digitales, cuya única sede fuera de Francia se encuentra en Santiago, implementó diversas técnicas de preprocesamiento de datos y redes neuronales para mejorar la precisión de las predicciones. Se utilizaron métodos supervisados de machine learning para clasificar estrellas según su origen, mostrando avances significativos en la identificación de cúmulos abiertos.
Theo, originario de Italia, tiene un título en Astronomía y una maestría en Ciencias de Datos para la Física de la Universidad de Padua. Su principal interés es aprovechar grandes conjuntos de datos y técnicas de aprendizaje automático para estudiar la evolución de las galaxias. En su reciente estudio, Theo y su equipo aplicaron varias técnicas de preprocesamiento de datos para mejorar la calidad de las predicciones.
En su investigación, Theo detalló: “Aplicamos varias técnicas de preprocesamiento de datos para mejorar la calidad de nuestras predicciones. Estas técnicas incluyen la selección de características, la eliminación de datos ruidosos y no informativos, y el análisis de componentes principales (PCA)”. La selección de características permitió que los modelos de predicción se enfocaran en la información más relevante, mejorando así la eficiencia de los mismos. Por otro lado, la eliminación de datos ruidosos ayudó a evitar que errores o datos no informativos afectaran negativamente las predicciones. “El análisis de componentes principales (PCA) nos permitió reducir la cantidad de variables al combinarlas, manteniendo la mayor parte de la información original”, explicó Theo, subrayando cómo esto simplificó los datos y mejoró la precisión de los modelos.
Además, el equipo de investigación utilizó una sofisticada red neuronal para el aprendizaje multitarea, lo que les permitió abordar varios problemas simultáneamente. “Esta avanzada técnica de inteligencia artificial es capaz de aprender y mejorar continuamente a partir de múltiples fuentes de datos, proporcionando un nivel superior de análisis y predicción”, comentó Theo. Estos pasos permitieron que los modelos de aprendizaje automático se entrenaran con datos más claros y relevantes, mejorando significativamente la precisión de las predicciones.
La colaboración con Inria, prestigioso instituto francés de investigación, fue fundamental para el éxito del estudio. Theo señaló que “Inria desempeñó un papel crucial en nuestra investigación, desarrollando técnicas avanzadas de análisis de datos y machine learning”. Además de proporcionar herramientas y métodos innovadores, los investigadores de Inria aportaron valiosas ideas y perspectivas que enriquecieron el enfoque del equipo. “Sus sugerencias innovadoras sobre cómo abordar los desafíos de nuestro estudio y cómo aplicar de manera efectiva los métodos de machine learning para identificar patrones químicos en las estrellas fueron invaluables”, agregó Theo.
El enfoque supervisado de machine learning fue elegido debido a la disponibilidad de un conjunto de datos etiquetado, lo que permitió al equipo entrenar modelos para reconocer y clasificar estrellas según su origen. “Optamos por un enfoque supervisado de machine learning porque teníamos un conjunto de datos etiquetado, lo que nos permitió entrenar a los modelos para reconocer y clasificar estrellas según su origen”, explicó Theo. A diferencia de otros estudios que se han centrado en el agrupamiento (clustering), el equipo descubrió que la clasificación era más adecuada para sus objetivos.
Para determinar los clasificadores más apropiados, Theo y su equipo probaron varios modelos, incluyendo árboles de decisión, bosques aleatorios y máquinas de soporte vectorial. “Evaluamos su desempeño en términos de precisión y capacidad para recuperar cúmulos abiertos correctamente”, detalló Theo. Finalmente, eligieron los clasificadores que mostraron la mejor precisión y consistencia en sus experimentos, asegurando así que sus predicciones fueran lo más precisas y confiables posible.
La aceptación de este paper subraya la importancia de la colaboración internacional y el uso de tecnologías avanzadas en la investigación astronómica. Este logro no solo destaca el talento y la dedicación de Theosamuele Signor, sino también el potencial de las técnicas de machine learning para revolucionar nuestro entendimiento del universo.