Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica

En este trabajo, se presenta una metodología orientada a procesar datos provenientes de censos o encuestas. La metodología propuesta se basa en las características de los grandes volúmenes de datos y la relevancia que tiene la información que se obtiene de censos o encuestas. El método propuesto abo...

Full description

Bibliographic Details
Main Author: Ruiz, Zoila
Other Authors: Garcia-Rodriguez, Jose
Format: Doctoral Thesis
Language:Spanish
Published: Universidad de Alicante 2019
Subjects:
Online Access:http://hdl.handle.net/10045/95608
id ndltd-ua.es-oai-rua.ua.es-10045-95608
record_format oai_dc
spelling ndltd-ua.es-oai-rua.ua.es-10045-956082021-06-04T05:14:24Z Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica Ruiz, Zoila Garcia-Rodriguez, Jose Universidad de Alicante. Departamento de Tecnología Informática y Computación Universidad de Alicante. Instituto Universitario de Investigación Informática Big Data Aprendizaje Automático Datos demográficos Censos Arquitectura y Tecnología de Computadores En este trabajo, se presenta una metodología orientada a procesar datos provenientes de censos o encuestas. La metodología propuesta se basa en las características de los grandes volúmenes de datos y la relevancia que tiene la información que se obtiene de censos o encuestas. El método propuesto aborda el problema de imputación de datos perdidos o ausentes que son muy frecuentes en censos o encuestas. Previo al proceso de imputación, la información necesita ser procesada para extraer un subconjunto de información completa necesaria para entrenar modelos de aprendizaje automático con la finalidad de predecir los valores ausentes. Para conseguir este dataset se utilizaron varias técnicas tradicionales tales como Pairwise Deletion y Listwise Deletion con la finalidad de eliminar observaciones que presentan valores perdidos. Como siguiente paso en la metodología, se plantea la generación de grupos de información a través de técnicas de aprendizaje automático no supervisado y a través de redes neuronales artificiales. Estos grupos de información que comparten características comunes sirven como fuente de entrada en el proceso de imputación de datos perdidos o ausentes. Los resultados obtenidos en la fase experimental muestran que la generación de grupos (de forma manual o automática) permiten mejorar la clasificación de la variable de prueba, sin embargo también se debe considerar la etapa previa a la de generación de grupos. Finalmente, como caso de estudio para validar la propuesta se plantea la imputación de datos para calcular la tasa de mortalidad infantil con brechas educativas para lo cual se seleccionó un dataset de pruebas de una región geográfica específica. 2019-09-04T13:25:32Z 2019-09-04T13:25:32Z 2019 2019 2019-06-11 info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10045/95608 spa Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 info:eu-repo/semantics/openAccess Universidad de Alicante
collection NDLTD
language Spanish
format Doctoral Thesis
sources NDLTD
topic Big Data
Aprendizaje Automático
Datos demográficos
Censos
Arquitectura y Tecnología de Computadores
spellingShingle Big Data
Aprendizaje Automático
Datos demográficos
Censos
Arquitectura y Tecnología de Computadores
Ruiz, Zoila
Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
description En este trabajo, se presenta una metodología orientada a procesar datos provenientes de censos o encuestas. La metodología propuesta se basa en las características de los grandes volúmenes de datos y la relevancia que tiene la información que se obtiene de censos o encuestas. El método propuesto aborda el problema de imputación de datos perdidos o ausentes que son muy frecuentes en censos o encuestas. Previo al proceso de imputación, la información necesita ser procesada para extraer un subconjunto de información completa necesaria para entrenar modelos de aprendizaje automático con la finalidad de predecir los valores ausentes. Para conseguir este dataset se utilizaron varias técnicas tradicionales tales como Pairwise Deletion y Listwise Deletion con la finalidad de eliminar observaciones que presentan valores perdidos. Como siguiente paso en la metodología, se plantea la generación de grupos de información a través de técnicas de aprendizaje automático no supervisado y a través de redes neuronales artificiales. Estos grupos de información que comparten características comunes sirven como fuente de entrada en el proceso de imputación de datos perdidos o ausentes. Los resultados obtenidos en la fase experimental muestran que la generación de grupos (de forma manual o automática) permiten mejorar la clasificación de la variable de prueba, sin embargo también se debe considerar la etapa previa a la de generación de grupos. Finalmente, como caso de estudio para validar la propuesta se plantea la imputación de datos para calcular la tasa de mortalidad infantil con brechas educativas para lo cual se seleccionó un dataset de pruebas de una región geográfica específica.
author2 Garcia-Rodriguez, Jose
author_facet Garcia-Rodriguez, Jose
Ruiz, Zoila
author Ruiz, Zoila
author_sort Ruiz, Zoila
title Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
title_short Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
title_full Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
title_fullStr Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
title_full_unstemmed Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
title_sort técnicas de aprendizaje automático aplicadas al procesamiento de información demográfica
publisher Universidad de Alicante
publishDate 2019
url http://hdl.handle.net/10045/95608
work_keys_str_mv AT ruizzoila tecnicasdeaprendizajeautomaticoaplicadasalprocesamientodeinformaciondemografica
_version_ 1719409091613294592