Data shift mitigation in classifiers of variable stars

Loading...
Thumbnail Image
Date
2024
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
En la actualidad el aprendizaje de máquinas desempeña un papel crucial en la clasificación automática de estrellas variables. Numerosos clasificadores han sido propuestos, alcanzado un alto rendimiento en las diferentes métricas de clasificación. Sin embargo, estos clasificadores se ven afectados por sesgos en los datos de entrenamiento, lo que limita su efectividad en datos no vistos. Estas limitaciones dañan la capacidad de generalización, generando múltiples problemas como la selección de modelos incorrectos y un desempeño sobreestimado. En este contexto, esta tesis introduce métodos para evaluar y entrenar clasificadores bajo condiciones de desplazamiento de datos. En primer lugar, se explora una probabilidad marginal informativa para seleccionar clasificadores de estrellas RR Lyrae, mitigando los sesgos a través de la incorporación de reglas deterministas basadas en parámetros físicos durante su estimación. Luego, se propone mejorar el entrenamiento de un perceptrón multicapa para la clasificación del mismo tipo de estrellas. Se injecta conocimiento a través de rangos de parámetros físicos que informan a un regularizador. Un algoritmo de retropropagación en dos pasos fusiona este conocimiento en la red neuronal, minimizando el error de clasificación y gestionando el equilibrio entre el aprendizaje a partir de datos y el conocimiento experto. Por último, utilizando el mismo esquema dual de aprendizaje se propone un aprendizaje auto regulado para una red neuronal convolucional, que toma ventaja de los recientes avances en modelos generativos para la creación de curvas de luz sintéticas durante el entrenamiento. En conclusión, esta tesis avanza en la integración del conocimiento experto en modelos de aprendizaje automático, proporcionando nuevas metodologías de evaluación y entrenamiento para clasificadores de estrellas variables. Estos avances mejoran las capacidades de generalización y predicción, ofreciendo adicionalmente novedosos y pertinentes esquemas de aprendizaje para futuras investigaciones.
Description
Tesis (Doctor in Engineering Sciences)--Pontificia Universidad Católica de Chile. Escuela de Ingeniería, 2024
Keywords
Estrellas variables, Desplazamiento de datos, Aprendizaje supervisado, Conocimiento experto, Clasificación
Citation