Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales

Ingeniero Civil Eléctrico === El propósito del presente trabajo es estudiar y proponer un método de aprendizaje para los Ensambles de Redes Neuronales basados en la maximización de la Información Mutua Cuadrática entre las salidas de los modelos que componen el Ensamble. En esencia el método propues...

Full description

Bibliographic Details
Main Author:	Saavedra Doren, Pablo Antonio
Other Authors:	Estévez Valencia, Pablo
Language:	es
Published:	Universidad de Chile 2018
Subjects:	Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana
Online Access:	http://repositorio.uchile.cl/handle/2250/150340

id	ndltd-UCHILE-oai-repositorio.uchile.cl-2250-150340
record_format	oai_dc
spelling	ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1503402018-11-05T05:37:21Z Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales Saavedra Doren, Pablo Antonio Estévez Valencia, Pablo Huijse Heise, Pablo Zegers Fernández, Pablo Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana Ingeniero Civil Eléctrico El propósito del presente trabajo es estudiar y proponer un método de aprendizaje para los Ensambles de Redes Neuronales basados en la maximización de la Información Mutua Cuadrática entre las salidas de los modelos que componen el Ensamble. En esencia el método propuesto es una función de costo que incluye un término de regularización basado en Información Mutua que se estima a partir del Potencial de Información Cruzado o CIP (Cross Information Potential), además el término de regularización busca favorecer la diversidad entre los modelos del Ensamble. Al método propuesto se le identifica en este trabajo como CIPL (Cross Information Potential Learning). La hipótesis de trabajo es que la utilización de herramientas de Teoría de la Información en la definición de la función de costo de CIPL pueden ayudar a mejorar la precisión y la diversidad del Ensamble comparado con el método basado en correlación negativa propuesto por el método NCL (Negative Correlation Learning) además de ayudar a favorecer más aun la diversidad. La metodología de trabajo incluye primeramente la implementación de una librería desarrollada en el lenguaje de programación Python para poder entrenar modelos de redes neuronales en forma paralela con el fin de poder probar el método de entrenamiento NCL y CIPL. Para evaluar el método de entrenamiento CIPL se realizan pruebas sobre problemas de regresión y clasificación típicos, parte de estas pruebas intentan determinar su comportamiento bajo condiciones de ruido y valores atípicos. Para el caso de CIPL se agregan pruebas sobre los diferentes hiperparámetros que tiene. Los resultados obtenidos muestran que CIPL tiene un desempeño similar que NCL en problemas de clasificación, no así en regresión donde NCL es mucho mejor. En cuanto a los hiperparámetros de CIPL se destaca que la sinergia y la redundancia influyen directamente en la diversidad del Ensamble, incluso permiten obtener mejores niveles de diversidad que NCL. La implementación de CIPL tiene problemas con los tiempos de entrenamiento que aumentan de forma exponencial con la cantidad de muestras y de modelos del Ensamble, por lo que requiere una optimización del código. Por otro lado, aunque la diversidad en el caso de CIPL mejora los resultados, no es posible cuantificar este efecto, por tanto se deja propuesto para trabajos futuros. Además, falta resolver problemas que tiene la implementación de CIPL cuando se trabaja con más de 2 clases. 2018-07-26T19:57:25Z 2018-07-26T19:57:25Z 2017 Tesis http://repositorio.uchile.cl/handle/2250/150340 es Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile
collection	NDLTD
language	es
sources	NDLTD
topic	Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana
spellingShingle	Redes neuronales (Ciencia de la computación) Teoría de la información Potencial de información cruzada Divergencia Euclidiana Saavedra Doren, Pablo Antonio Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
description	Ingeniero Civil Eléctrico === El propósito del presente trabajo es estudiar y proponer un método de aprendizaje para los Ensambles de Redes Neuronales basados en la maximización de la Información Mutua Cuadrática entre las salidas de los modelos que componen el Ensamble. En esencia el método propuesto es una función de costo que incluye un término de regularización basado en Información Mutua que se estima a partir del Potencial de Información Cruzado o CIP (Cross Information Potential), además el término de regularización busca favorecer la diversidad entre los modelos del Ensamble. Al método propuesto se le identifica en este trabajo como CIPL (Cross Information Potential Learning). La hipótesis de trabajo es que la utilización de herramientas de Teoría de la Información en la definición de la función de costo de CIPL pueden ayudar a mejorar la precisión y la diversidad del Ensamble comparado con el método basado en correlación negativa propuesto por el método NCL (Negative Correlation Learning) además de ayudar a favorecer más aun la diversidad. La metodología de trabajo incluye primeramente la implementación de una librería desarrollada en el lenguaje de programación Python para poder entrenar modelos de redes neuronales en forma paralela con el fin de poder probar el método de entrenamiento NCL y CIPL. Para evaluar el método de entrenamiento CIPL se realizan pruebas sobre problemas de regresión y clasificación típicos, parte de estas pruebas intentan determinar su comportamiento bajo condiciones de ruido y valores atípicos. Para el caso de CIPL se agregan pruebas sobre los diferentes hiperparámetros que tiene. Los resultados obtenidos muestran que CIPL tiene un desempeño similar que NCL en problemas de clasificación, no así en regresión donde NCL es mucho mejor. En cuanto a los hiperparámetros de CIPL se destaca que la sinergia y la redundancia influyen directamente en la diversidad del Ensamble, incluso permiten obtener mejores niveles de diversidad que NCL. La implementación de CIPL tiene problemas con los tiempos de entrenamiento que aumentan de forma exponencial con la cantidad de muestras y de modelos del Ensamble, por lo que requiere una optimización del código. Por otro lado, aunque la diversidad en el caso de CIPL mejora los resultados, no es posible cuantificar este efecto, por tanto se deja propuesto para trabajos futuros. Además, falta resolver problemas que tiene la implementación de CIPL cuando se trabaja con más de 2 clases.
author2	Estévez Valencia, Pablo
author_facet	Estévez Valencia, Pablo Saavedra Doren, Pablo Antonio
author	Saavedra Doren, Pablo Antonio
author_sort	Saavedra Doren, Pablo Antonio
title	Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
title_short	Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
title_full	Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
title_fullStr	Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
title_full_unstemmed	Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
title_sort	estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales
publisher	Universidad de Chile
publishDate	2018
url	http://repositorio.uchile.cl/handle/2250/150340
work_keys_str_mv	AT saavedradorenpabloantonio estudiodelautilizaciondelpotencialdeinformacioncruzadoenelaprendizajeconensamblederedesneuronales
_version_	1718788423260569600

Estudio de la utilización del potencial de información cruzado en el aprendizaje con ensamble de redes neuronales

Similar Items