Classification paramétrique robuste partiellement supervisée en reconnaissance des formes
L'apprentissage est une étape importante d'un processus de reconnaissance des formes pour<br />la décision. On distingue généralement l'approche supervisée de l'approche non supervisée suivant<br />que l'on dispose ou non d'une expertise des données. Dans ce...
Main Author: | |
---|---|
Language: | FRE |
Published: |
Université de La Rochelle
2001
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00145895 http://tel.archives-ouvertes.fr/docs/00/14/58/95/PDF/these_csj.pdf |
Summary: | L'apprentissage est une étape importante d'un processus de reconnaissance des formes pour<br />la décision. On distingue généralement l'approche supervisée de l'approche non supervisée suivant<br />que l'on dispose ou non d'une expertise des données. Dans ce travail, nous étudions le cas<br />intermédiaire d'une classification semi-supervisée où l'on dispose d'un ensemble mixte de données<br />numériques.<br />Certains éléments à traiter diffèrent du modèle a priori supposé des données et peuvent perturber<br />le processus d'apprentissage. Les méthodes robustes de classification visent à limiter l'influence<br />de ces données aberrantes soit en les modélisant explicitement, soit en utilisant des estimateurs<br />robustes. La première partie de ce travail nous a permis d'étudier la notion de robustesse à<br />travers divers algorithmes de classification. Un intérêt particulier est porté à l'utilisation des<br />M-estimateurs de Huber dans le cadre de l'estimation par le principe du maximum de vraisemblance.<br />La seconde partie de cette étude est consacrée à l'état de l'art des principales méthodes de<br />classification semi-supervisée. Nous montrons que celles-ci reposent sur la modification de la<br />fonctionnelle réalisant la classification en introduisant un terme d'accord avec la mesure d'appartenance<br />fixée par l'expert.<br />Sur la base de ces deux domaines, nous proposons un algorithme robuste de classification partiellement<br />supervisée introduisant une option de rejet. Les classes sont modélisées par un mélange<br />de deux composantes dont les paramètres sont estimées par un calcul itératif robuste. Le rejet<br />est effectué par une fonction d'affectation produisant une classe additionnelle dédiée aux points<br />aberrants. Les résultats obtenus sur divers jeux de données artificiels et réels nous ont permis de<br />valider notre approche. |
---|