Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
El objetivo de la generación automática de resúmenes es reducir la dimensión de un texto y a su vez mantener la información relevante del mismo. En este artículo se analiza y aplica la técnica de Análisis de Componentes Principales, que es independiente del idioma, para la generación de resúmenes e...
Main Authors: | , |
---|---|
Format: | Article |
Language: | Catalan |
Published: |
Universidade do Minho & Universidade de Vigo
2015-07-01
|
Series: | Linguamática |
Subjects: | |
Online Access: | http://linguamatica.com/index.php/linguamatica/article/view/205 |
id |
doaj-83c9d07283314b91b87fe198c3b64d47 |
---|---|
record_format |
Article |
spelling |
doaj-83c9d07283314b91b87fe198c3b64d472020-11-24T20:40:43ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182015-07-0171Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingüesÓscar Alcón0Elena Lloret1Universidad de AlicanteUniversidad de Alicante El objetivo de la generación automática de resúmenes es reducir la dimensión de un texto y a su vez mantener la información relevante del mismo. En este artículo se analiza y aplica la técnica de Análisis de Componentes Principales, que es independiente del idioma, para la generación de resúmenes extractivos mono-documento y multilingües. Dicha técnica se estudiará con el objetivo de poder evaluar su funcionamiento cuando se incorpora (o no) conocimiento léxico-semántico, a partir del uso de recursos y herramientas dependientes del idioma. La experimentación propuesta se ha realizado en base a dos corpus de diferente naturaleza: noticias periodísticas y artículos de la Wikipedia en tres idiomas (alemán, español e inglés) para verificar el uso de esta técnica en varios escenarios. Los enfoques propuestos presentan resultados muy competitivos comparados con generadores de resúmenes multilingües existentes, lo que indica que, aunque exista un claro margen de mejora respecto a la técnica y el tipo de conocimiento incorporado, ésta tiene una gran potencial para ser aplicada en otros contextos e idiomas. http://linguamatica.com/index.php/linguamatica/article/view/205PCAAnálisis de Componentes Principalesgeneración de resúmenesmultilingüesextractivosentidades nombradas |
collection |
DOAJ |
language |
Catalan |
format |
Article |
sources |
DOAJ |
author |
Óscar Alcón Elena Lloret |
spellingShingle |
Óscar Alcón Elena Lloret Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües Linguamática PCA Análisis de Componentes Principales generación de resúmenes multilingües extractivos entidades nombradas |
author_facet |
Óscar Alcón Elena Lloret |
author_sort |
Óscar Alcón |
title |
Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües |
title_short |
Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües |
title_full |
Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües |
title_fullStr |
Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües |
title_full_unstemmed |
Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües |
title_sort |
estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de análisis de componentes principales para la generación de resúmenes multilingües |
publisher |
Universidade do Minho & Universidade de Vigo |
series |
Linguamática |
issn |
1647-0818 |
publishDate |
2015-07-01 |
description |
El objetivo de la generación automática de resúmenes es reducir la dimensión de un texto y a su vez mantener la información relevante del mismo. En este artículo se analiza y aplica la técnica de Análisis de Componentes Principales, que es independiente del idioma, para la generación de resúmenes extractivos mono-documento y multilingües. Dicha técnica se estudiará con el objetivo de poder evaluar su funcionamiento cuando se incorpora (o no) conocimiento léxico-semántico, a partir del uso de recursos y herramientas dependientes del idioma. La experimentación propuesta se ha realizado en base a dos corpus de diferente naturaleza: noticias periodísticas y artículos de la Wikipedia en tres idiomas (alemán, español e inglés) para verificar el uso de esta técnica en varios escenarios. Los enfoques propuestos presentan resultados muy competitivos comparados con generadores de resúmenes multilingües existentes, lo que indica que, aunque exista un claro margen de mejora respecto a la técnica y el tipo de conocimiento incorporado, ésta tiene una gran potencial para ser aplicada en otros contextos e idiomas.
|
topic |
PCA Análisis de Componentes Principales generación de resúmenes multilingües extractivos entidades nombradas |
url |
http://linguamatica.com/index.php/linguamatica/article/view/205 |
work_keys_str_mv |
AT oscaralcon estudiodelainfluenciadeincorporarconocimientolexicosemanticoalatecnicadeanalisisdecomponentesprincipalesparalageneracionderesumenesmultilingues AT elenalloret estudiodelainfluenciadeincorporarconocimientolexicosemanticoalatecnicadeanalisisdecomponentesprincipalesparalageneracionderesumenesmultilingues |
_version_ |
1716825862506020864 |