REPRESENTACIÓN CONCEPTUAL PARA LA CLASIFICACIÓN MULTILINGUE DE TEXTOS

Hoy en día, el porcentaje de la información disponible en Inglés en Word Wide Web está disminuyendo, debido a que otros lenguajes como: chino, español, árabe y portugués están ganando aceptación y difusión. Este fenómeno ha provocado que el multilingüismo se convierta en uno de los principales retos...

Full description

Bibliographic Details
Main Authors: Arisbel Borges García, Daniel Castro Castro, Reynier Ortega Bueno
Format: Article
Language:English
Published: Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte 2018-06-01
Series:Holos
Subjects:
Online Access:http://www2.ifrn.edu.br/ojs/index.php/HOLOS/article/view/4682
Description
Summary:Hoy en día, el porcentaje de la información disponible en Inglés en Word Wide Web está disminuyendo, debido a que otros lenguajes como: chino, español, árabe y portugués están ganando aceptación y difusión. Este fenómeno ha provocado que el multilingüismo se convierta en uno de los principales retos para el procesamiento inteligente, gestión y recuperación de documentos. Con el fin de hacer frente a este problema de forma eficaz, los sistemas computacionales necesitan el diseño de nuevos modelos o mejorar los modelos tradicionales de representación de documentos. La disponibilidad de repositorios multilingües de conceptos y redes semánticas, ha abierto un enfoque atractivo para modelar documentos escritos en diferentes lenguas, como los vectores de conceptos en un espacio común de representación. En este trabajo se presenta una nueva representación basada en conceptos usando Multilingual Central Repository. Nuestra propuesta  aplica una desambiguación del sentido de la palabra de grano grueso para la selección del concepto apropiado de acuerdo con el tema y los dominios relevantes reflejados en los documentos. Evaluamos experimentalmente nuestro método en la tarea de clasificación de documentos multilingües. Los resultados obtenidos en los experimentos son alentadores y demuestran la utilidad del método propuesto.
ISSN:1807-1600