REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS

Hoy en día, el porcentaje de la información disponible en Inglés en Word Wide Web está disminuyendo, debido a que otros lenguajes como: chino, español, árabe y portugués están ganando aceptación y difusión. Este fenómeno ha provocado que el multilingüismo se convierta en uno de los principales retos...

Full description

Bibliographic Details
Main Authors: Arisbel Borges García, Daniel Castro Castro, Reynier Ortega Bueno
Format: Article
Language:English
Published: Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte 2018-06-01
Series:Holos
Subjects:
Online Access:http://www2.ifrn.edu.br/ojs/index.php/HOLOS/article/view/4682
id doaj-fa4b0138ee5749cf899fc0900f180dbb
record_format Article
spelling doaj-fa4b0138ee5749cf899fc0900f180dbb2020-11-25T03:03:39ZengInstituto Federal de Educação, Ciência e Tecnologia do Rio Grande do NorteHolos1807-16002018-06-012038639610.15628/holos.2018.46821927REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOSArisbel Borges García0Daniel Castro Castro1Reynier Ortega Bueno2Universidad de Oriente, Santiago de Cuba, Cuba.CERPAMIDCERPAMIDHoy en día, el porcentaje de la información disponible en Inglés en Word Wide Web está disminuyendo, debido a que otros lenguajes como: chino, español, árabe y portugués están ganando aceptación y difusión. Este fenómeno ha provocado que el multilingüismo se convierta en uno de los principales retos para el procesamiento inteligente, gestión y recuperación de documentos. Con el fin de hacer frente a este problema de forma eficaz, los sistemas computacionales necesitan el diseño de nuevos modelos o mejorar los modelos tradicionales de representación de documentos. La disponibilidad de repositorios multilingües de conceptos y redes semánticas, ha abierto un enfoque atractivo para modelar documentos escritos en diferentes lenguas, como los vectores de conceptos en un espacio común de representación. En este trabajo se presenta una nueva representación basada en conceptos usando Multilingual Central Repository. Nuestra propuesta  aplica una desambiguación del sentido de la palabra de grano grueso para la selección del concepto apropiado de acuerdo con el tema y los dominios relevantes reflejados en los documentos. Evaluamos experimentalmente nuestro método en la tarea de clasificación de documentos multilingües. Los resultados obtenidos en los experimentos son alentadores y demuestran la utilidad del método propuesto.http://www2.ifrn.edu.br/ojs/index.php/HOLOS/article/view/4682representación conceptual de documentosclasificación multilingüe de documentosdesambiguación conceptual por dominio
collection DOAJ
language English
format Article
sources DOAJ
author Arisbel Borges García
Daniel Castro Castro
Reynier Ortega Bueno
spellingShingle Arisbel Borges García
Daniel Castro Castro
Reynier Ortega Bueno
REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS
Holos
representación conceptual de documentos
clasificación multilingüe de documentos
desambiguación conceptual por dominio
author_facet Arisbel Borges García
Daniel Castro Castro
Reynier Ortega Bueno
author_sort Arisbel Borges García
title REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS
title_short REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS
title_full REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS
title_fullStr REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS
title_full_unstemmed REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS
title_sort representación conceptual para la clasificación multilingue de textos
publisher Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte
series Holos
issn 1807-1600
publishDate 2018-06-01
description Hoy en día, el porcentaje de la información disponible en Inglés en Word Wide Web está disminuyendo, debido a que otros lenguajes como: chino, español, árabe y portugués están ganando aceptación y difusión. Este fenómeno ha provocado que el multilingüismo se convierta en uno de los principales retos para el procesamiento inteligente, gestión y recuperación de documentos. Con el fin de hacer frente a este problema de forma eficaz, los sistemas computacionales necesitan el diseño de nuevos modelos o mejorar los modelos tradicionales de representación de documentos. La disponibilidad de repositorios multilingües de conceptos y redes semánticas, ha abierto un enfoque atractivo para modelar documentos escritos en diferentes lenguas, como los vectores de conceptos en un espacio común de representación. En este trabajo se presenta una nueva representación basada en conceptos usando Multilingual Central Repository. Nuestra propuesta  aplica una desambiguación del sentido de la palabra de grano grueso para la selección del concepto apropiado de acuerdo con el tema y los dominios relevantes reflejados en los documentos. Evaluamos experimentalmente nuestro método en la tarea de clasificación de documentos multilingües. Los resultados obtenidos en los experimentos son alentadores y demuestran la utilidad del método propuesto.
topic representación conceptual de documentos
clasificación multilingüe de documentos
desambiguación conceptual por dominio
url http://www2.ifrn.edu.br/ojs/index.php/HOLOS/article/view/4682
work_keys_str_mv AT arisbelborgesgarcia representacionconceptualparalaclasificacionmultilinguedetextos
AT danielcastrocastro representacionconceptualparalaclasificacionmultilinguedetextos
AT reynierortegabueno representacionconceptualparalaclasificacionmultilinguedetextos
_version_ 1724684513117732864