Titulación automática de preguntas en encuestas electorales
Este artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir...
Main Authors: | , |
---|---|
Format: | Article |
Language: | Spanish |
Published: |
Consejo Superior de Investigaciones Científicas
2016-06-01
|
Series: | Revista Española de Documentación Científica |
Subjects: | |
Online Access: | http://redc.revistas.csic.es/index.php/redc/article/view/936 |
id |
doaj-aedbb967f56149b78c9f70e05fceda2a |
---|---|
record_format |
Article |
spelling |
doaj-aedbb967f56149b78c9f70e05fceda2a2021-05-05T07:08:41ZspaConsejo Superior de Investigaciones CientíficasRevista Española de Documentación Científica0210-06141988-46212016-06-01392e133e13310.3989/redc.2016.2.1236872Titulación automática de preguntas en encuestas electoralesCarolina Gallardo0Jesús Cardeñosa1Departmento de Sistemas de Información, Escuela Técnica Superior de Sistemas Informáticos. Universidad Politécnica de MadridGrupo de Validación y Aplicaciones Industriales. ETS de Ingenieros Informáticos. Universidad Politécnica de MadridEste artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir dos requisitos: desde el punto de vista de la forma, debe ser gramaticalmente correcto y tener un estilo similar a los ya existentes; y, desde el punto de vista del contenido, debe albergar el tema de la pregunta y las distintas categorías de respuesta. Estas restricciones en cuanto a la forma y al contenido de los títulos desaconsejan el uso de técnicas empleadas en problemas similares, como el resumen automático o aprendizaje automático con corpus de entrenamiento, a favor de una metodología basada en el análisis y conocimiento del dominio. Para ilustrar el análisis y la estrategia de resolución del problema seguidos, hemos seleccionado las preguntas relacionadas con temas electorales, debido a la importancia estratégica y a la especialización del CIS en este tipo de encuestas. Se describe en detalle el procedimiento seguido y la evaluación de los resultados, valorando tanto los aspectos cualitativos como los cuantitativos. La evaluación muestra que el 88,73% de los títulos generados cumplen estrictamente con los requisitos de forma y contenido impuestos por el CIS, lo que supone un ahorro en el trabajo manual del personal cualificado de la institución.http://redc.revistas.csic.es/index.php/redc/article/view/936minería de textosrecuperación de informaciónfiltradoclasificaciónresumen y visualizacióntitulación automáticaextracción de informaciónencuestas de opinión |
collection |
DOAJ |
language |
Spanish |
format |
Article |
sources |
DOAJ |
author |
Carolina Gallardo Jesús Cardeñosa |
spellingShingle |
Carolina Gallardo Jesús Cardeñosa Titulación automática de preguntas en encuestas electorales Revista Española de Documentación Científica minería de textos recuperación de información filtrado clasificación resumen y visualización titulación automática extracción de información encuestas de opinión |
author_facet |
Carolina Gallardo Jesús Cardeñosa |
author_sort |
Carolina Gallardo |
title |
Titulación automática de preguntas en encuestas electorales |
title_short |
Titulación automática de preguntas en encuestas electorales |
title_full |
Titulación automática de preguntas en encuestas electorales |
title_fullStr |
Titulación automática de preguntas en encuestas electorales |
title_full_unstemmed |
Titulación automática de preguntas en encuestas electorales |
title_sort |
titulación automática de preguntas en encuestas electorales |
publisher |
Consejo Superior de Investigaciones Científicas |
series |
Revista Española de Documentación Científica |
issn |
0210-0614 1988-4621 |
publishDate |
2016-06-01 |
description |
Este artículo describe el trabajo realizado para la generación automática de los títulos de las preguntas pertenecientes a las encuestas de opinión que existen en las bases de datos del CIS (Centro de Investigaciones Sociológicas). Dentro del contexto del CIS, el título de una pregunta debe cumplir dos requisitos: desde el punto de vista de la forma, debe ser gramaticalmente correcto y tener un estilo similar a los ya existentes; y, desde el punto de vista del contenido, debe albergar el tema de la pregunta y las distintas categorías de respuesta. Estas restricciones en cuanto a la forma y al contenido de los títulos desaconsejan el uso de técnicas empleadas en problemas similares, como el resumen automático o aprendizaje automático con corpus de entrenamiento, a favor de una metodología basada en el análisis y conocimiento del dominio. Para ilustrar el análisis y la estrategia de resolución del problema seguidos, hemos seleccionado las preguntas relacionadas con temas electorales, debido a la importancia estratégica y a la especialización del CIS en este tipo de encuestas. Se describe en detalle el procedimiento seguido y la evaluación de los resultados, valorando tanto los aspectos cualitativos como los cuantitativos. La evaluación muestra que el 88,73% de los títulos generados cumplen estrictamente con los requisitos de forma y contenido impuestos por el CIS, lo que supone un ahorro en el trabajo manual del personal cualificado de la institución. |
topic |
minería de textos recuperación de información filtrado clasificación resumen y visualización titulación automática extracción de información encuestas de opinión |
url |
http://redc.revistas.csic.es/index.php/redc/article/view/936 |
work_keys_str_mv |
AT carolinagallardo titulacionautomaticadepreguntasenencuestaselectorales AT jesuscardenosa titulacionautomaticadepreguntasenencuestaselectorales |
_version_ |
1721472867087941632 |