Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües

El objetivo de la generación automática de resúmenes es reducir la dimensión de un texto y a su vez mantener la información relevante del mismo. En este artículo se analiza y aplica la técnica de Análisis de Componentes Principales, que es independiente del idioma, para la generación de resúmenes e...

Full description

Bibliographic Details
Main Authors: Óscar Alcón, Elena Lloret
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2015-07-01
Series:Linguamática
Subjects:
PCA
Online Access:http://linguamatica.com/index.php/linguamatica/article/view/205
id doaj-83c9d07283314b91b87fe198c3b64d47
record_format Article
spelling doaj-83c9d07283314b91b87fe198c3b64d472020-11-24T20:40:43ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182015-07-0171Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingüesÓscar Alcón0Elena Lloret1Universidad de AlicanteUniversidad de Alicante El objetivo de la generación automática de resúmenes es reducir la dimensión de un texto y a su vez mantener la información relevante del mismo. En este artículo se analiza y aplica la técnica de Análisis de Componentes Principales, que es independiente del idioma, para la generación de resúmenes extractivos mono-documento y multilingües. Dicha técnica se estudiará con el objetivo de poder evaluar su funcionamiento cuando se incorpora (o no) conocimiento léxico-semántico, a partir del uso de recursos y herramientas dependientes del idioma. La experimentación propuesta se ha realizado en base a dos corpus de diferente naturaleza: noticias periodísticas y artículos de la Wikipedia en tres idiomas (alemán, español e inglés) para verificar el uso de esta técnica en varios escenarios. Los enfoques propuestos presentan resultados muy competitivos comparados con generadores de resúmenes multilingües existentes, lo que indica que, aunque exista un claro margen de mejora respecto a la técnica y el tipo de conocimiento incorporado, ésta tiene una gran potencial para ser aplicada en otros contextos e idiomas. http://linguamatica.com/index.php/linguamatica/article/view/205PCAAnálisis de Componentes Principalesgeneración de resúmenesmultilingüesextractivosentidades nombradas
collection DOAJ
language Catalan
format Article
sources DOAJ
author Óscar Alcón
Elena Lloret
spellingShingle Óscar Alcón
Elena Lloret
Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
Linguamática
PCA
Análisis de Componentes Principales
generación de resúmenes
multilingües
extractivos
entidades nombradas
author_facet Óscar Alcón
Elena Lloret
author_sort Óscar Alcón
title Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
title_short Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
title_full Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
title_fullStr Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
title_full_unstemmed Estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de Análisis de Componentes Principales para la generación de resúmenes multilingües
title_sort estudio de la influencia de incorporar conocimiento léxico-semántico a la técnica de análisis de componentes principales para la generación de resúmenes multilingües
publisher Universidade do Minho & Universidade de Vigo
series Linguamática
issn 1647-0818
publishDate 2015-07-01
description El objetivo de la generación automática de resúmenes es reducir la dimensión de un texto y a su vez mantener la información relevante del mismo. En este artículo se analiza y aplica la técnica de Análisis de Componentes Principales, que es independiente del idioma, para la generación de resúmenes extractivos mono-documento y multilingües. Dicha técnica se estudiará con el objetivo de poder evaluar su funcionamiento cuando se incorpora (o no) conocimiento léxico-semántico, a partir del uso de recursos y herramientas dependientes del idioma. La experimentación propuesta se ha realizado en base a dos corpus de diferente naturaleza: noticias periodísticas y artículos de la Wikipedia en tres idiomas (alemán, español e inglés) para verificar el uso de esta técnica en varios escenarios. Los enfoques propuestos presentan resultados muy competitivos comparados con generadores de resúmenes multilingües existentes, lo que indica que, aunque exista un claro margen de mejora respecto a la técnica y el tipo de conocimiento incorporado, ésta tiene una gran potencial para ser aplicada en otros contextos e idiomas.
topic PCA
Análisis de Componentes Principales
generación de resúmenes
multilingües
extractivos
entidades nombradas
url http://linguamatica.com/index.php/linguamatica/article/view/205
work_keys_str_mv AT oscaralcon estudiodelainfluenciadeincorporarconocimientolexicosemanticoalatecnicadeanalisisdecomponentesprincipalesparalageneracionderesumenesmultilingues
AT elenalloret estudiodelainfluenciadeincorporarconocimientolexicosemanticoalatecnicadeanalisisdecomponentesprincipalesparalageneracionderesumenesmultilingues
_version_ 1716825862506020864