La catégorisation grammaticale automatique: adaptation du catégoriseur de Brill au français et modification de l'approche
La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l’anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour e...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | FR |
Published: |
Université Laval
2004
|
Subjects: | |
Online Access: | http://www.theses.ulaval.ca/2004/22225/22225.html http://www.theses.ulaval.ca/2004/22225/22225.pdf |
Summary: | La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l’anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour ensuite en améliorer les résultats. Par ailleurs, quelle que soit la technique utilisée, certains problèmes restent irrésolus. Les mots inconnus sont toujours difficiles à catégoriser correctement. Nous avons tenté de trouver des solutions à ce problème. En somme, nous avons apporté une série de modifications à l’approche de Brill et évalué l’impact de celles-ci sur les performances. Les modifications apportées ont permis de faire passer les performances du traitement des mots inconnus français de 70,7% à 78,6%. Nous avons donc amélioré sensiblement les performances bien qu’il reste encore beaucoup de travail à faire avant que le traitement des mots inconnus français soit satisfaisant. === Inscrite au Tableau d'honneur de la Faculté des études supérieures |
---|