Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica
En este trabajo, se presenta una metodología orientada a procesar datos provenientes de censos o encuestas. La metodología propuesta se basa en las características de los grandes volúmenes de datos y la relevancia que tiene la información que se obtiene de censos o encuestas. El método propuesto abo...
Main Author: | |
---|---|
Other Authors: | |
Format: | Doctoral Thesis |
Language: | Spanish |
Published: |
Universidad de Alicante
2019
|
Subjects: | |
Online Access: | http://hdl.handle.net/10045/95608 |
id |
ndltd-ua.es-oai-rua.ua.es-10045-95608 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-ua.es-oai-rua.ua.es-10045-956082021-06-04T05:14:24Z Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica Ruiz, Zoila Garcia-Rodriguez, Jose Universidad de Alicante. Departamento de Tecnología Informática y Computación Universidad de Alicante. Instituto Universitario de Investigación Informática Big Data Aprendizaje Automático Datos demográficos Censos Arquitectura y Tecnología de Computadores En este trabajo, se presenta una metodología orientada a procesar datos provenientes de censos o encuestas. La metodología propuesta se basa en las características de los grandes volúmenes de datos y la relevancia que tiene la información que se obtiene de censos o encuestas. El método propuesto aborda el problema de imputación de datos perdidos o ausentes que son muy frecuentes en censos o encuestas. Previo al proceso de imputación, la información necesita ser procesada para extraer un subconjunto de información completa necesaria para entrenar modelos de aprendizaje automático con la finalidad de predecir los valores ausentes. Para conseguir este dataset se utilizaron varias técnicas tradicionales tales como Pairwise Deletion y Listwise Deletion con la finalidad de eliminar observaciones que presentan valores perdidos. Como siguiente paso en la metodología, se plantea la generación de grupos de información a través de técnicas de aprendizaje automático no supervisado y a través de redes neuronales artificiales. Estos grupos de información que comparten características comunes sirven como fuente de entrada en el proceso de imputación de datos perdidos o ausentes. Los resultados obtenidos en la fase experimental muestran que la generación de grupos (de forma manual o automática) permiten mejorar la clasificación de la variable de prueba, sin embargo también se debe considerar la etapa previa a la de generación de grupos. Finalmente, como caso de estudio para validar la propuesta se plantea la imputación de datos para calcular la tasa de mortalidad infantil con brechas educativas para lo cual se seleccionó un dataset de pruebas de una región geográfica específica. 2019-09-04T13:25:32Z 2019-09-04T13:25:32Z 2019 2019 2019-06-11 info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10045/95608 spa Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 info:eu-repo/semantics/openAccess Universidad de Alicante |
collection |
NDLTD |
language |
Spanish |
format |
Doctoral Thesis |
sources |
NDLTD |
topic |
Big Data Aprendizaje Automático Datos demográficos Censos Arquitectura y Tecnología de Computadores |
spellingShingle |
Big Data Aprendizaje Automático Datos demográficos Censos Arquitectura y Tecnología de Computadores Ruiz, Zoila Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica |
description |
En este trabajo, se presenta una metodología orientada a procesar datos provenientes de censos o encuestas. La metodología propuesta se basa en las características de los grandes volúmenes de datos y la relevancia que tiene la información que se obtiene de censos o encuestas. El método propuesto aborda el problema de imputación de datos perdidos o ausentes que son muy frecuentes en censos o encuestas. Previo al proceso de imputación, la información necesita ser procesada para extraer un subconjunto de información completa necesaria para entrenar modelos de aprendizaje automático con la finalidad de predecir los valores ausentes. Para conseguir este dataset se utilizaron varias técnicas tradicionales tales como Pairwise Deletion y Listwise Deletion con la finalidad de eliminar observaciones que presentan valores perdidos. Como siguiente paso en la metodología, se plantea la generación de grupos de información a través de técnicas de aprendizaje automático no supervisado y a través de redes neuronales artificiales. Estos grupos de información que comparten características comunes sirven como fuente de entrada en el proceso de imputación de datos perdidos o ausentes. Los resultados obtenidos en la fase experimental muestran que la generación de grupos (de forma manual o automática) permiten mejorar la clasificación de la variable de prueba, sin embargo también se debe considerar la etapa previa a la de generación de grupos. Finalmente, como caso de estudio para validar la propuesta se plantea la imputación de datos para calcular la tasa de mortalidad infantil con brechas educativas para lo cual se seleccionó un dataset de pruebas de una región geográfica específica. |
author2 |
Garcia-Rodriguez, Jose |
author_facet |
Garcia-Rodriguez, Jose Ruiz, Zoila |
author |
Ruiz, Zoila |
author_sort |
Ruiz, Zoila |
title |
Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica |
title_short |
Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica |
title_full |
Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica |
title_fullStr |
Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica |
title_full_unstemmed |
Técnicas de Aprendizaje Automático Aplicadas al Procesamiento de Información Demográfica |
title_sort |
técnicas de aprendizaje automático aplicadas al procesamiento de información demográfica |
publisher |
Universidad de Alicante |
publishDate |
2019 |
url |
http://hdl.handle.net/10045/95608 |
work_keys_str_mv |
AT ruizzoila tecnicasdeaprendizajeautomaticoaplicadasalprocesamientodeinformaciondemografica |
_version_ |
1719409091613294592 |