La catégorisation grammaticale automatique: adaptation du catégoriseur de Brill au français et modification de l'approche

La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l’anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour e...

Full description

Bibliographic Details
Main Author: Thibeault, Mélanie
Other Authors: Ladouceur, Jacques
Format: Others
Language:FR
Published: Université Laval 2004
Subjects:
Online Access:http://www.theses.ulaval.ca/2004/22225/22225.html
http://www.theses.ulaval.ca/2004/22225/22225.pdf
Description
Summary:La catégorisation grammaticale automatique est un domaine où il reste encore beaucoup à faire. De très bons catégoriseurs existent pour l’anglais, mais ceux dont dispose la communauté francophone sont beaucoup moins efficaces. Nous avons donc entraîné le catégoriseur de Brill pour le français pour ensuite en améliorer les résultats. Par ailleurs, quelle que soit la technique utilisée, certains problèmes restent irrésolus. Les mots inconnus sont toujours difficiles à catégoriser correctement. Nous avons tenté de trouver des solutions à ce problème. En somme, nous avons apporté une série de modifications à l’approche de Brill et évalué l’impact de celles-ci sur les performances. Les modifications apportées ont permis de faire passer les performances du traitement des mots inconnus français de 70,7% à 78,6%. Nous avons donc amélioré sensiblement les performances bien qu’il reste encore beaucoup de travail à faire avant que le traitement des mots inconnus français soit satisfaisant. === Inscrite au Tableau d'honneur de la Faculté des études supérieures