Kernels para la clasificacíon de preguntas en español y catalán
Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de...
Main Authors: | , |
---|---|
Format: | Article |
Language: | Catalan |
Published: |
Universidade do Minho & Universidade de Vigo
2009-11-01
|
Series: | Linguamática |
Online Access: | http://linguamatica.com/index.php/linguamatica/article/view/31 |
id |
doaj-1657a56c63734b599505bfbaeac97255 |
---|---|
record_format |
Article |
spelling |
doaj-1657a56c63734b599505bfbaeac972552020-11-24T20:44:23ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182009-11-0112Kernels para la clasificacíon de preguntas en español y catalánDavid Tomás0José Luis Vicedo1Universidad de AlicanteUniversidad de Alicante Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de un sistema fácilmente adaptable a diferentes idiomas. Se ha realizado un estudio sobre el correcto a juste de parámetros de los kernels, la precisíon de los mismos, la definicíon de distintos vectores de características de aprendizaje y el rendimiento en función del idioma de trabajo. Adicionalmente, se ha experimentado con el algoritmo LIBLINEAR, aplicado aquí por vez primera a la tarea de clasificación de preguntas. Con este algoritmo, así como con los kernels definidos, se han obtenido valores de precisión por encima del 80 % para los dos idiomas tratados, superando a otros algoritmos tradicionales de clasificación. Para el entrenamiento y evaluación del sistema se ha desarrollado un corpus paralelo de 2.393 preguntas en inglés, español y catalán. http://linguamatica.com/index.php/linguamatica/article/view/31 |
collection |
DOAJ |
language |
Catalan |
format |
Article |
sources |
DOAJ |
author |
David Tomás José Luis Vicedo |
spellingShingle |
David Tomás José Luis Vicedo Kernels para la clasificacíon de preguntas en español y catalán Linguamática |
author_facet |
David Tomás José Luis Vicedo |
author_sort |
David Tomás |
title |
Kernels para la clasificacíon de preguntas en español y catalán |
title_short |
Kernels para la clasificacíon de preguntas en español y catalán |
title_full |
Kernels para la clasificacíon de preguntas en español y catalán |
title_fullStr |
Kernels para la clasificacíon de preguntas en español y catalán |
title_full_unstemmed |
Kernels para la clasificacíon de preguntas en español y catalán |
title_sort |
kernels para la clasificacíon de preguntas en español y catalán |
publisher |
Universidade do Minho & Universidade de Vigo |
series |
Linguamática |
issn |
1647-0818 |
publishDate |
2009-11-01 |
description |
Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de un sistema fácilmente adaptable a diferentes idiomas. Se ha realizado un estudio sobre el correcto a juste de parámetros de los kernels, la precisíon de los mismos, la definicíon de distintos vectores de características de aprendizaje y el rendimiento en función del idioma de trabajo. Adicionalmente, se ha experimentado con el algoritmo LIBLINEAR, aplicado aquí por vez primera a la tarea de clasificación de preguntas. Con este algoritmo, así como con los kernels definidos, se han obtenido valores de precisión por encima del 80 % para los dos idiomas tratados, superando a otros algoritmos tradicionales de clasificación. Para el entrenamiento y evaluación del sistema se ha desarrollado un corpus paralelo de 2.393 preguntas en inglés, español y catalán.
|
url |
http://linguamatica.com/index.php/linguamatica/article/view/31 |
work_keys_str_mv |
AT davidtomas kernelsparalaclasificaciondepreguntasenespanolycatalan AT joseluisvicedo kernelsparalaclasificaciondepreguntasenespanolycatalan |
_version_ |
1716817557939290112 |