Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
Ingeniero Civil Eléctrico === El propósito del presente trabajo es estudiar y proponer un método de aprendizaje para los Ensambles de Redes Neuronales basados en la maximización de la Información Mutua Cuadrática entre las salidas de los modelos que componen el Ensamble. En esencia el método propues...
Main Author: | |
---|---|
Other Authors: | |
Language: | es |
Published: |
Universidad de Chile
2018
|
Subjects: | |
Online Access: | http://repositorio.uchile.cl/handle/2250/150340 |
id |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-150340 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1503402018-11-05T05:37:21Z Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales Saavedra Doren, Pablo Antonio Estévez Valencia, Pablo Huijse Heise, Pablo Zegers Fernández, Pablo Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana Ingeniero Civil Eléctrico El propósito del presente trabajo es estudiar y proponer un método de aprendizaje para los Ensambles de Redes Neuronales basados en la maximización de la Información Mutua Cuadrática entre las salidas de los modelos que componen el Ensamble. En esencia el método propuesto es una función de costo que incluye un término de regularización basado en Información Mutua que se estima a partir del Potencial de Información Cruzado o CIP (Cross Information Potential), además el término de regularización busca favorecer la diversidad entre los modelos del Ensamble. Al método propuesto se le identifica en este trabajo como CIPL (Cross Information Potential Learning). La hipótesis de trabajo es que la utilización de herramientas de Teoría de la Información en la definición de la función de costo de CIPL pueden ayudar a mejorar la precisión y la diversidad del Ensamble comparado con el método basado en correlación negativa propuesto por el método NCL (Negative Correlation Learning) además de ayudar a favorecer más aun la diversidad. La metodología de trabajo incluye primeramente la implementación de una librería desarrollada en el lenguaje de programación Python para poder entrenar modelos de redes neuronales en forma paralela con el fin de poder probar el método de entrenamiento NCL y CIPL. Para evaluar el método de entrenamiento CIPL se realizan pruebas sobre problemas de regresión y clasificación típicos, parte de estas pruebas intentan determinar su comportamiento bajo condiciones de ruido y valores atípicos. Para el caso de CIPL se agregan pruebas sobre los diferentes hiperparámetros que tiene. Los resultados obtenidos muestran que CIPL tiene un desempeño similar que NCL en problemas de clasificación, no así en regresión donde NCL es mucho mejor. En cuanto a los hiperparámetros de CIPL se destaca que la sinergia y la redundancia influyen directamente en la diversidad del Ensamble, incluso permiten obtener mejores niveles de diversidad que NCL. La implementación de CIPL tiene problemas con los tiempos de entrenamiento que aumentan de forma exponencial con la cantidad de muestras y de modelos del Ensamble, por lo que requiere una optimización del código. Por otro lado, aunque la diversidad en el caso de CIPL mejora los resultados, no es posible cuantificar este efecto, por tanto se deja propuesto para trabajos futuros. Además, falta resolver problemas que tiene la implementación de CIPL cuando se trabaja con más de 2 clases. 2018-07-26T19:57:25Z 2018-07-26T19:57:25Z 2017 Tesis http://repositorio.uchile.cl/handle/2250/150340 es Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile |
collection |
NDLTD |
language |
es |
sources |
NDLTD |
topic |
Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana |
spellingShingle |
Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana Saavedra Doren, Pablo Antonio Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
description |
Ingeniero Civil Eléctrico === El propósito del presente trabajo es estudiar y proponer un método de aprendizaje para los Ensambles de Redes Neuronales basados en la maximización de la Información Mutua Cuadrática entre las salidas de los modelos que componen el Ensamble. En esencia el método propuesto es una función de costo que incluye un término de regularización basado en Información Mutua que se estima a partir del Potencial de Información Cruzado o CIP (Cross Information Potential), además el término de regularización busca favorecer la diversidad entre los modelos del Ensamble. Al método propuesto se le identifica en este trabajo como CIPL (Cross Information Potential Learning).
La hipótesis de trabajo es que la utilización de herramientas de Teoría de la Información en la definición de la función de costo de CIPL pueden ayudar a mejorar la precisión y la diversidad del Ensamble comparado con el método basado en correlación negativa propuesto por el método NCL (Negative Correlation Learning) además de ayudar a favorecer más aun la diversidad.
La metodología de trabajo incluye primeramente la implementación de una librería desarrollada en el lenguaje de programación Python para poder entrenar modelos de redes neuronales en forma paralela con el fin de poder probar el método de entrenamiento NCL y CIPL. Para evaluar el método de entrenamiento CIPL se realizan pruebas sobre problemas de regresión y clasificación típicos, parte de estas pruebas intentan determinar su comportamiento bajo condiciones de ruido y valores atípicos. Para el caso de CIPL se agregan pruebas sobre los diferentes hiperparámetros que tiene.
Los resultados obtenidos muestran que CIPL tiene un desempeño similar que NCL en problemas de clasificación, no así en regresión donde NCL es mucho mejor. En cuanto a los hiperparámetros de CIPL se destaca que la sinergia y la redundancia influyen directamente en la diversidad del Ensamble, incluso permiten obtener mejores niveles de diversidad que NCL.
La implementación de CIPL tiene problemas con los tiempos de entrenamiento que aumentan de forma exponencial con la cantidad de muestras y de modelos del Ensamble, por lo que requiere una optimización del código. Por otro lado, aunque la diversidad en el caso de CIPL mejora los resultados, no es posible cuantificar este efecto, por tanto se deja propuesto para trabajos futuros. Además, falta resolver problemas que tiene la implementación de CIPL cuando se trabaja con más de 2 clases. |
author2 |
Estévez Valencia, Pablo |
author_facet |
Estévez Valencia, Pablo Saavedra Doren, Pablo Antonio |
author |
Saavedra Doren, Pablo Antonio |
author_sort |
Saavedra Doren, Pablo Antonio |
title |
Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
title_short |
Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
title_full |
Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
title_fullStr |
Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
title_full_unstemmed |
Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
title_sort |
estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales |
publisher |
Universidad de Chile |
publishDate |
2018 |
url |
http://repositorio.uchile.cl/handle/2250/150340 |
work_keys_str_mv |
AT saavedradorenpabloantonio estudiodelautilizaciondelpotencialdeinformacioncruzadoenelaprendizajeconensamblederedesneuronales |
_version_ |
1718788423260569600 |