Herramienta basada en técnicas de Deep Learning para el análisis de datos generados por el telescopio ESA Euclid

Alumno investigador: David Población Criado

Centro: Departamento de Informática (ATC, CCIA, LSI), Escuela de Ingeniería Informática.

Resumen de las tareas realizadas:

El incremento de los volúmenes de datos generados en los últimos años en astronomía obliga a utilizar nuevos métodos automáticos de minería de datos, al tener tal magnitud que resulta imposible su tratamiento manual por seres humanos.
En primer lugar se ha llevado a cabo un estudio de los conceptos astrofísicos y relativos a técnicas deep learning a través de distintos materiales como libros o artículos en revistas especializadas.
Sobre el primero de los conjuntos de datos tratados, el de la colaboración Euclid, se ha estudiado el funcionamiento de redes neuronales convolucionales (CNNs) con respecto a una serie de preguntas relativas a la morfología de las galaxias sobre dos conjuntos de datos. Para ello, se han realizado las siguientes baterías de experimentos, donde cada batería viene condicionada por las conclusiones y discusión de la anterior: regresión, clasificación (sin y con pesos) y regularización L2.
Además, se ha analizado el número mínimo de galaxias necesarias para entrenar la red y obtener un rendimiento similar al conseguido por el máximo número de galaxias disponibles. Esta segunda cuestión resulta de gran utilidad dado que el número de astrónomos disponibles para etiquetar imágenes es muy limitado.
Para el segundo de los conjuntos de datos, sobre generación sintética, se han utilizado también CNNs para detectar estructuras de bajo brillo superficial, las cuales son difusas y, a veces, subjetivas. Los resultados mostrados son preliminares, sobre una investigación aún en curso.

Objetivos alcanzados:

  • Investigación y estudio sobre fundamentos del aprendizaje automático y modelos de última generación (state-of-the-art).
  • Estudio de conceptos básicos de astrofísica necesarios para entender la dimensión del problema, interpretar los datos de partida y los resultados obtenidos.
  • Aprendizaje de frameworks deep learning y de tratamiento de imágenes astronómicas.
  • Detección de ciertas características relativas a la morfología de imágenes astronómicas. Para ello se van a desarrollar múltiples modelos basados en regresión y clasificación.
  • Estudio del número de datos necesarios para obtener el máximo rendimiento, en base a ciertas métricas fijadas.
  • Detección de estructuras de bajo brillo superficial.

Sectores de aplicación:

Caracterización de galaxias según su morfología en base a ciertas preguntas, en concreto sobre las imágenes que capte el telescopio espacial ESAEuclid.
Detección de estructuras de bajo brillo superficial.

Metodología utilizada:

Desarrollo iterativo e incremental, siguiendo una metodología basada en datos (data driven).