Deep learning para identificación de núcleos activos de galaxias por variabilidad
Magíster en Ciencias, Mención Computación === En la presente era de datos masivos, la astronomía requiere de herramientas automatizadas para el análisis de información asociada al comportamiento de objetos a lo largo del tiempo. El desarrollo de proyectos de observación sinópticos plantea muchos des...
Main Author: | |
---|---|
Other Authors: | |
Language: | es |
Published: |
Universidad de Chile
2019
|
Subjects: | |
Online Access: | http://repositorio.uchile.cl/handle/2250/168059 |
id |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-168059 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1680592019-11-29T09:24:57Z Deep learning para identificación de núcleos activos de galaxias por variabilidad Miranda Castillo, Nicolás Martín Hitschfeld Kahler, Nancy Lira Teillery, Paulina Hogan, Aidan Cabrera Vives, Guillermo Allende Cid, Hector Astronomía - Observaciones - Procesamiento de datos Computadores - Procesamiento de imagen Análisis de series de tiempo Curvas de luz Magíster en Ciencias, Mención Computación En la presente era de datos masivos, la astronomía requiere de herramientas automatizadas para el análisis de información asociada al comportamiento de objetos a lo largo del tiempo. El desarrollo de proyectos de observación sinópticos plantea muchos desafíos en lo que respecta a obtener descripciones relevantes de los aspectos subyacentes de muchos procesos variables en el tiempo. En particular, el estudio de los Núcleos Activos de Galaxia (AGN) resulta de especial interés; dado su comportamiento estocástico en el tiempo y la singular estructura en la variación temporal de su emisión electromagnética. El uso de algoritmos de aprendizaje computacional ha sido de gran éxito en aspectos de identificación de objetos según su morfología y análisis espectral; es de mucho valor el replicar esos resultados en el análisis de dominio temporal. Con este fin es que se puso a prueba distintas configuraciones de arquitecturas de algoritmos de Deep Learning, en particular Convolutional Neural Networks y Recurrent Neural Networks, con el fin de realizar tareas de clasificación de AGN a partir de sus curvas de luz. Estos se pusieron a prueba sobre datos simulados mediante un modelo matemático y sobre 6102 curvas de luz reales obtenidas a partir de observaciones de los campos extragalácticos COSMOS, Stripe82 y XMM-LSS. Los resultados fueron favorables sobre datos simulados, alcanzando un puntaje ROC AUC máximo de 0.96, pero no así sobre datos reales, donde el puntaje máximo alcanzado fue de 0.55 ROC AUC. Esta diferencia puede explicarse debido al reducido número de datos reales del que se dispuso a la hora de entrenar los distintos clasificadores, y a que el modelo de simulación permitió generar un mucho mayor número de curvas de entrenamiento, lo cual permitió un mucho mejor aprendizaje a partir de estas. El presente trabajo entregó información cuantitativa sobre lo importantes que son ciertas características de las curvas de luz, en particular la regularidad de su muestreo y el número de observaciones, en el desempeño de estos tipos de modelos de clasificación de Deep Learning. Junto con esto, se plantea un flujo en el procedimiento de manejo de datos de curvas de luz para clasificación, desde su recolección desde archivos de formato estándar (FITS) hasta la validación de los modelos, que puede ser reutilizado en el futuro en aplicaciones de Deep Learning sobre series de tiempo. Se sugiere, además, el añadir en próximas implementaciones métodos para manejo de incertidumbre debido a ausencia de mediciones, tales como modelos gráficos, de estado oculto o estocásticos. 2019-04-10T19:26:14Z 2019-04-10T19:26:14Z 2018 Tesis http://repositorio.uchile.cl/handle/2250/168059 es Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile |
collection |
NDLTD |
language |
es |
sources |
NDLTD |
topic |
Astronomía - Observaciones - Procesamiento de datos Computadores - Procesamiento de imagen Análisis de series de tiempo Curvas de luz |
spellingShingle |
Astronomía - Observaciones - Procesamiento de datos Computadores - Procesamiento de imagen Análisis de series de tiempo Curvas de luz Miranda Castillo, Nicolás Martín Deep learning para identificación de núcleos activos de galaxias por variabilidad |
description |
Magíster en Ciencias, Mención Computación === En la presente era de datos masivos, la astronomía requiere de herramientas automatizadas para el análisis de información asociada al comportamiento de objetos a lo largo del tiempo. El desarrollo de proyectos de observación sinópticos plantea muchos desafíos en lo que respecta a obtener descripciones relevantes de los aspectos subyacentes de muchos procesos variables en el tiempo.
En particular, el estudio de los Núcleos Activos de Galaxia (AGN) resulta de especial interés; dado su comportamiento estocástico en el tiempo y la singular estructura en la variación temporal de su emisión electromagnética. El uso de algoritmos de aprendizaje computacional ha sido de gran éxito en aspectos de identificación de objetos según su morfología y análisis espectral; es de mucho valor el replicar esos resultados en el análisis de dominio temporal.
Con este fin es que se puso a prueba distintas configuraciones de arquitecturas de algoritmos de Deep Learning, en particular Convolutional Neural Networks y Recurrent Neural Networks, con el fin de realizar tareas de clasificación de AGN a partir de sus curvas de luz. Estos se pusieron a prueba sobre datos simulados mediante un modelo matemático y sobre 6102 curvas de luz reales obtenidas a partir de observaciones de los campos extragalácticos COSMOS, Stripe82 y XMM-LSS.
Los resultados fueron favorables sobre datos simulados, alcanzando un puntaje ROC AUC máximo de 0.96, pero no así sobre datos reales, donde el puntaje máximo alcanzado fue de 0.55 ROC AUC. Esta diferencia puede explicarse debido al reducido número de datos reales del que se dispuso a la hora de entrenar los distintos clasificadores, y a que el modelo de simulación permitió generar un mucho mayor número de curvas de entrenamiento, lo cual permitió un mucho mejor aprendizaje a partir de estas.
El presente trabajo entregó información cuantitativa sobre lo importantes que son ciertas características de las curvas de luz, en particular la regularidad de su muestreo y el número de observaciones, en el desempeño de estos tipos de modelos de clasificación de Deep Learning. Junto con esto, se plantea un flujo en el procedimiento de manejo de datos de curvas de luz para clasificación, desde su recolección desde archivos de formato estándar (FITS) hasta la validación de los modelos, que puede ser reutilizado en el futuro en aplicaciones de Deep Learning sobre series de tiempo. Se sugiere, además, el añadir en próximas implementaciones métodos para manejo de incertidumbre debido a ausencia de mediciones, tales como modelos gráficos, de estado oculto o estocásticos. |
author2 |
Hitschfeld Kahler, Nancy |
author_facet |
Hitschfeld Kahler, Nancy Miranda Castillo, Nicolás Martín |
author |
Miranda Castillo, Nicolás Martín |
author_sort |
Miranda Castillo, Nicolás Martín |
title |
Deep learning para identificación de núcleos activos de galaxias por variabilidad |
title_short |
Deep learning para identificación de núcleos activos de galaxias por variabilidad |
title_full |
Deep learning para identificación de núcleos activos de galaxias por variabilidad |
title_fullStr |
Deep learning para identificación de núcleos activos de galaxias por variabilidad |
title_full_unstemmed |
Deep learning para identificación de núcleos activos de galaxias por variabilidad |
title_sort |
deep learning para identificación de núcleos activos de galaxias por variabilidad |
publisher |
Universidad de Chile |
publishDate |
2019 |
url |
http://repositorio.uchile.cl/handle/2250/168059 |
work_keys_str_mv |
AT mirandacastillonicolasmartin deeplearningparaidentificaciondenucleosactivosdegalaxiasporvariabilidad |
_version_ |
1719299338284302336 |