Deep learning para identificación de núcleos activos de galaxias por variabilidad

Magíster en Ciencias, Mención Computación === En la presente era de datos masivos, la astronomía requiere de herramientas automatizadas para el análisis de información asociada al comportamiento de objetos a lo largo del tiempo. El desarrollo de proyectos de observación sinópticos plantea muchos des...

Full description

Bibliographic Details
Main Author: Miranda Castillo, Nicolás Martín
Other Authors: Hitschfeld Kahler, Nancy
Language:es
Published: Universidad de Chile 2019
Subjects:
Online Access:http://repositorio.uchile.cl/handle/2250/168059
id ndltd-UCHILE-oai-repositorio.uchile.cl-2250-168059
record_format oai_dc
spelling ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1680592019-11-29T09:24:57Z Deep learning para identificación de núcleos activos de galaxias por variabilidad Miranda Castillo, Nicolás Martín Hitschfeld Kahler, Nancy Lira Teillery, Paulina Hogan, Aidan Cabrera Vives, Guillermo Allende Cid, Hector Astronomía - Observaciones - Procesamiento de datos Computadores - Procesamiento de imagen Análisis de series de tiempo Curvas de luz Magíster en Ciencias, Mención Computación En la presente era de datos masivos, la astronomía requiere de herramientas automatizadas para el análisis de información asociada al comportamiento de objetos a lo largo del tiempo. El desarrollo de proyectos de observación sinópticos plantea muchos desafíos en lo que respecta a obtener descripciones relevantes de los aspectos subyacentes de muchos procesos variables en el tiempo. En particular, el estudio de los Núcleos Activos de Galaxia (AGN) resulta de especial interés; dado su comportamiento estocástico en el tiempo y la singular estructura en la variación temporal de su emisión electromagnética. El uso de algoritmos de aprendizaje computacional ha sido de gran éxito en aspectos de identificación de objetos según su morfología y análisis espectral; es de mucho valor el replicar esos resultados en el análisis de dominio temporal. Con este fin es que se puso a prueba distintas configuraciones de arquitecturas de algoritmos de Deep Learning, en particular Convolutional Neural Networks y Recurrent Neural Networks, con el fin de realizar tareas de clasificación de AGN a partir de sus curvas de luz. Estos se pusieron a prueba sobre datos simulados mediante un modelo matemático y sobre 6102 curvas de luz reales obtenidas a partir de observaciones de los campos extragalácticos COSMOS, Stripe82 y XMM-LSS. Los resultados fueron favorables sobre datos simulados, alcanzando un puntaje ROC AUC máximo de 0.96, pero no así sobre datos reales, donde el puntaje máximo alcanzado fue de 0.55 ROC AUC. Esta diferencia puede explicarse debido al reducido número de datos reales del que se dispuso a la hora de entrenar los distintos clasificadores, y a que el modelo de simulación permitió generar un mucho mayor número de curvas de entrenamiento, lo cual permitió un mucho mejor aprendizaje a partir de estas. El presente trabajo entregó información cuantitativa sobre lo importantes que son ciertas características de las curvas de luz, en particular la regularidad de su muestreo y el número de observaciones, en el desempeño de estos tipos de modelos de clasificación de Deep Learning. Junto con esto, se plantea un flujo en el procedimiento de manejo de datos de curvas de luz para clasificación, desde su recolección desde archivos de formato estándar (FITS) hasta la validación de los modelos, que puede ser reutilizado en el futuro en aplicaciones de Deep Learning sobre series de tiempo. Se sugiere, además, el añadir en próximas implementaciones métodos para manejo de incertidumbre debido a ausencia de mediciones, tales como modelos gráficos, de estado oculto o estocásticos. 2019-04-10T19:26:14Z 2019-04-10T19:26:14Z 2018 Tesis http://repositorio.uchile.cl/handle/2250/168059 es Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile
collection NDLTD
language es
sources NDLTD
topic Astronomía - Observaciones - Procesamiento de datos
Computadores - Procesamiento de imagen
Análisis de series de tiempo
Curvas de luz
spellingShingle Astronomía - Observaciones - Procesamiento de datos
Computadores - Procesamiento de imagen
Análisis de series de tiempo
Curvas de luz
Miranda Castillo, Nicolás Martín
Deep learning para identificación de núcleos activos de galaxias por variabilidad
description Magíster en Ciencias, Mención Computación === En la presente era de datos masivos, la astronomía requiere de herramientas automatizadas para el análisis de información asociada al comportamiento de objetos a lo largo del tiempo. El desarrollo de proyectos de observación sinópticos plantea muchos desafíos en lo que respecta a obtener descripciones relevantes de los aspectos subyacentes de muchos procesos variables en el tiempo. En particular, el estudio de los Núcleos Activos de Galaxia (AGN) resulta de especial interés; dado su comportamiento estocástico en el tiempo y la singular estructura en la variación temporal de su emisión electromagnética. El uso de algoritmos de aprendizaje computacional ha sido de gran éxito en aspectos de identificación de objetos según su morfología y análisis espectral; es de mucho valor el replicar esos resultados en el análisis de dominio temporal. Con este fin es que se puso a prueba distintas configuraciones de arquitecturas de algoritmos de Deep Learning, en particular Convolutional Neural Networks y Recurrent Neural Networks, con el fin de realizar tareas de clasificación de AGN a partir de sus curvas de luz. Estos se pusieron a prueba sobre datos simulados mediante un modelo matemático y sobre 6102 curvas de luz reales obtenidas a partir de observaciones de los campos extragalácticos COSMOS, Stripe82 y XMM-LSS. Los resultados fueron favorables sobre datos simulados, alcanzando un puntaje ROC AUC máximo de 0.96, pero no así sobre datos reales, donde el puntaje máximo alcanzado fue de 0.55 ROC AUC. Esta diferencia puede explicarse debido al reducido número de datos reales del que se dispuso a la hora de entrenar los distintos clasificadores, y a que el modelo de simulación permitió generar un mucho mayor número de curvas de entrenamiento, lo cual permitió un mucho mejor aprendizaje a partir de estas. El presente trabajo entregó información cuantitativa sobre lo importantes que son ciertas características de las curvas de luz, en particular la regularidad de su muestreo y el número de observaciones, en el desempeño de estos tipos de modelos de clasificación de Deep Learning. Junto con esto, se plantea un flujo en el procedimiento de manejo de datos de curvas de luz para clasificación, desde su recolección desde archivos de formato estándar (FITS) hasta la validación de los modelos, que puede ser reutilizado en el futuro en aplicaciones de Deep Learning sobre series de tiempo. Se sugiere, además, el añadir en próximas implementaciones métodos para manejo de incertidumbre debido a ausencia de mediciones, tales como modelos gráficos, de estado oculto o estocásticos.
author2 Hitschfeld Kahler, Nancy
author_facet Hitschfeld Kahler, Nancy
Miranda Castillo, Nicolás Martín
author Miranda Castillo, Nicolás Martín
author_sort Miranda Castillo, Nicolás Martín
title Deep learning para identificación de núcleos activos de galaxias por variabilidad
title_short Deep learning para identificación de núcleos activos de galaxias por variabilidad
title_full Deep learning para identificación de núcleos activos de galaxias por variabilidad
title_fullStr Deep learning para identificación de núcleos activos de galaxias por variabilidad
title_full_unstemmed Deep learning para identificación de núcleos activos de galaxias por variabilidad
title_sort deep learning para identificación de núcleos activos de galaxias por variabilidad
publisher Universidad de Chile
publishDate 2019
url http://repositorio.uchile.cl/handle/2250/168059
work_keys_str_mv AT mirandacastillonicolasmartin deeplearningparaidentificaciondenucleosactivosdegalaxiasporvariabilidad
_version_ 1719299338284302336