Kernels para la clasificacíon de preguntas en español y catalán

Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de...

Full description

Bibliographic Details
Main Authors: David Tomás, José Luis Vicedo
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2009-11-01
Series:Linguamática
Online Access:http://linguamatica.com/index.php/linguamatica/article/view/31
id doaj-1657a56c63734b599505bfbaeac97255
record_format Article
spelling doaj-1657a56c63734b599505bfbaeac972552020-11-24T20:44:23ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182009-11-0112Kernels para la clasificacíon de preguntas en español y catalánDavid Tomás0José Luis Vicedo1Universidad de AlicanteUniversidad de Alicante Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de un sistema fácilmente adaptable a diferentes idiomas. Se ha realizado un estudio sobre el correcto a juste de parámetros de los kernels, la precisíon de los mismos, la definicíon de distintos vectores de características de aprendizaje y el rendimiento en función del idioma de trabajo. Adicionalmente, se ha experimentado con el algoritmo LIBLINEAR, aplicado aquí por vez primera a la tarea de clasificación de preguntas. Con este algoritmo, así como con los kernels definidos, se han obtenido valores de precisión por encima del 80 % para los dos idiomas tratados, superando a otros algoritmos tradicionales de clasificación. Para el entrenamiento y evaluación del sistema se ha desarrollado un corpus paralelo de 2.393 preguntas en inglés, español y catalán. http://linguamatica.com/index.php/linguamatica/article/view/31
collection DOAJ
language Catalan
format Article
sources DOAJ
author David Tomás
José Luis Vicedo
spellingShingle David Tomás
José Luis Vicedo
Kernels para la clasificacíon de preguntas en español y catalán
Linguamática
author_facet David Tomás
José Luis Vicedo
author_sort David Tomás
title Kernels para la clasificacíon de preguntas en español y catalán
title_short Kernels para la clasificacíon de preguntas en español y catalán
title_full Kernels para la clasificacíon de preguntas en español y catalán
title_fullStr Kernels para la clasificacíon de preguntas en español y catalán
title_full_unstemmed Kernels para la clasificacíon de preguntas en español y catalán
title_sort kernels para la clasificacíon de preguntas en español y catalán
publisher Universidade do Minho & Universidade de Vigo
series Linguamática
issn 1647-0818
publishDate 2009-11-01
description Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de un sistema fácilmente adaptable a diferentes idiomas. Se ha realizado un estudio sobre el correcto a juste de parámetros de los kernels, la precisíon de los mismos, la definicíon de distintos vectores de características de aprendizaje y el rendimiento en función del idioma de trabajo. Adicionalmente, se ha experimentado con el algoritmo LIBLINEAR, aplicado aquí por vez primera a la tarea de clasificación de preguntas. Con este algoritmo, así como con los kernels definidos, se han obtenido valores de precisión por encima del 80 % para los dos idiomas tratados, superando a otros algoritmos tradicionales de clasificación. Para el entrenamiento y evaluación del sistema se ha desarrollado un corpus paralelo de 2.393 preguntas en inglés, español y catalán.
url http://linguamatica.com/index.php/linguamatica/article/view/31
work_keys_str_mv AT davidtomas kernelsparalaclasificaciondepreguntasenespanolycatalan
AT joseluisvicedo kernelsparalaclasificaciondepreguntasenespanolycatalan
_version_ 1716817557939290112