Titulación automática de preguntas en encuestas electorales

Este artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir...

Full description

Bibliographic Details
Main Authors: Carolina Gallardo, Jesús Cardeñosa
Format: Article
Language:Spanish
Published: Consejo Superior de Investigaciones Científicas 2016-06-01
Series:Revista Española de Documentación Científica
Subjects:
Online Access:http://redc.revistas.csic.es/index.php/redc/article/view/936
id doaj-aedbb967f56149b78c9f70e05fceda2a
record_format Article
spelling doaj-aedbb967f56149b78c9f70e05fceda2a2021-05-05T07:08:41ZspaConsejo Superior de Investigaciones CientíficasRevista Española de Documentación Científica0210-06141988-46212016-06-01392e133e13310.3989/redc.2016.2.1236872Titulación automática de preguntas en encuestas electoralesCarolina Gallardo0Jesús Cardeñosa1Departmento de Sistemas de Información, Escuela Técnica Superior de Sistemas Informáticos. Universidad Politécnica de MadridGrupo de Validación y Aplicaciones Industriales. ETS de Ingenieros Informáticos. Universidad Politécnica de MadridEste artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir dos requisitos: desde el punto de vista de la forma, debe ser gramaticalmente correcto y tener un estilo similar a los ya existentes; y, desde el punto de vista del contenido, debe albergar el tema de la pregunta y las distintas categorías de respuesta. Estas restricciones en cuanto a la forma y al contenido de los títulos desaconsejan el uso de técnicas empleadas en problemas similares, como el resumen automático o aprendizaje automático con corpus de entrenamiento, a favor de una metodología basada en el análisis y conocimiento del dominio. Para ilustrar el análisis y la estrategia de resolución del problema seguidos, hemos seleccionado las preguntas relacionadas con temas electorales, debido a la importancia estratégica y a la especialización del CIS en este tipo de encuestas. Se describe en detalle el procedimiento seguido y la evaluación de los resultados, valorando tanto los aspectos cualitativos como los cuantitativos. La evaluación muestra que el 88,73% de los títulos generados cumplen estrictamente con los requisitos de forma y contenido impuestos por el CIS, lo que supone un ahorro en el trabajo manual del personal cualificado de la institución.http://redc.revistas.csic.es/index.php/redc/article/view/936minería de textosrecuperación de informaciónfiltradoclasificaciónresumen y visualizacióntitulación automáticaextracción de informaciónencuestas de opinión
collection DOAJ
language Spanish
format Article
sources DOAJ
author Carolina Gallardo
Jesús Cardeñosa
spellingShingle Carolina Gallardo
Jesús Cardeñosa
Titulación automática de preguntas en encuestas electorales
Revista Española de Documentación Científica
minería de textos
recuperación de información
filtrado
clasificación
resumen y visualización
titulación automática
extracción de información
encuestas de opinión
author_facet Carolina Gallardo
Jesús Cardeñosa
author_sort Carolina Gallardo
title Titulación automática de preguntas en encuestas electorales
title_short Titulación automática de preguntas en encuestas electorales
title_full Titulación automática de preguntas en encuestas electorales
title_fullStr Titulación automática de preguntas en encuestas electorales
title_full_unstemmed Titulación automática de preguntas en encuestas electorales
title_sort titulación automática de preguntas en encuestas electorales
publisher Consejo Superior de Investigaciones Científicas
series Revista Española de Documentación Científica
issn 0210-0614
1988-4621
publishDate 2016-06-01
description Este artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir dos requisitos: desde el punto de vista de la forma, debe ser gramaticalmente correcto y tener un estilo similar a los ya existentes; y, desde el punto de vista del contenido, debe albergar el tema de la pregunta y las distintas categorías de respuesta. Estas restricciones en cuanto a la forma y al contenido de los títulos desaconsejan el uso de técnicas empleadas en problemas similares, como el resumen automático o aprendizaje automático con corpus de entrenamiento, a favor de una metodología basada en el análisis y conocimiento del dominio. Para ilustrar el análisis y la estrategia de resolución del problema seguidos, hemos seleccionado las preguntas relacionadas con temas electorales, debido a la importancia estratégica y a la especialización del CIS en este tipo de encuestas. Se describe en detalle el procedimiento seguido y la evaluación de los resultados, valorando tanto los aspectos cualitativos como los cuantitativos. La evaluación muestra que el 88,73% de los títulos generados cumplen estrictamente con los requisitos de forma y contenido impuestos por el CIS, lo que supone un ahorro en el trabajo manual del personal cualificado de la institución.
topic minería de textos
recuperación de información
filtrado
clasificación
resumen y visualización
titulación automática
extracción de información
encuestas de opinión
url http://redc.revistas.csic.es/index.php/redc/article/view/936
work_keys_str_mv AT carolinagallardo titulacionautomaticadepreguntasenencuestaselectorales
AT jesuscardenosa titulacionautomaticadepreguntasenencuestaselectorales
_version_ 1721472867087941632