Techniques de l'intelligence artificielle pour la classification d'objets biologiques dans des images bidimensionnelles
La reconnaissance visuelle d'objets biologiques comme les produits agro-alimentaires et les especes vegetales en milieu naturel a profite de percees majeures lors des 30 dernieres annees. Aujourd'hui, des algorithmes de reconnaissance performants sont utilises pour evaluer la qualite de...
Main Author: | |
---|---|
Format: | Others |
Published: |
École de technologie supérieure
2008
|
Online Access: | http://espace.etsmtl.ca/115/1/LEVASSEUR_Yan.pdf http://espace.etsmtl.ca/115/4/LEVASSEUR_Yan%2Dweb.pdf |
Summary: | La reconnaissance visuelle d'objets biologiques comme les produits agro-alimentaires et les
especes vegetales en milieu naturel a profite de percees majeures lors des 30 dernieres
annees. Aujourd'hui, des algorithmes de reconnaissance performants sont utilises pour
evaluer la qualite de productions agricoles et faire le suivi d'ecosysteme pour en assurer la
protection. Dans la plupart des cas, ce sont des experts en vision et en informatique qui ont
developpe les solutions personnalisees qui ont permis d'atteindre les resultats desires.
L'objectif de la recherche presentee est de foumir des recommandations pour le
developpement d'un algorithme de reconnaissance de formes dans des images qui soit
generique et qui necessite le moins d'intervention humaine possible. Un tel algorithme
pourrait etre utilise par les non experts, par exemple les ingenieurs en agro-alimentaire, les
botanistes et les biologistes. Pour atteindre notre objectif, nous avons etudie les etapes du
processus de reconnaissance a partir d'images.
En pratique, nous avons mis sur pied un systeme de segmentation, d'extraction de
caracteristiques et de classification, en plus d'avoir developpe un algorithme de
Programmation Genetique (PG). Nous avons integre ce dernier au logiciel libre d'exploration
des donnees Weka, afin d'encourager la mise en commun des efforts de recherche sur les
algorithmes evolutionnaires.
Les classificateurs utilises pour nos experimentations sont le classificateur naif de Bayes,
I'arbre de decision C4.5, le K Plus Proche Voisins (KPPV), la PG, le Separateur a Vastes
Marges (SVM) et le Perceptron Multicouche (PM). Dans une seconde serie d'experiences,
nous avons combine chacun de ces classificateurs, a 1'exception du KPPV, au meta
algorithme de boosting.
Nous avons compare les resultats de classification des six algorithmes choisis pour six bases
de donnees distinctes dont trois ont ete creees par nous. Les bases utilisees proviennent
d'images de cereales, de grains de pollen, de noeuds de bois, de raisins sees, de feuilles
d'arbres et de caracteres de I'alphabet romain.
Suite a une segmentation des bases d'images, nous avons extrait, a partir de chaque objet,
une quarantaine de caracteristiques. Une base de donnees alternatives a ete creee grace a la
transformation par Analyse en Composante Principale (ACP). Finalement, nous avons
compiles les resultats de classification des six classificateurs, puis de leur combinaison par
boosting pour les caracteristiques de base et pour les caracteristiques transformees. Chaque
experience a ete realisee 50 fois avec une separation aleatoire des bases d'apprentissage et de
test.
Nous avons observe de bonnes performances de classification pour les problemes comportant
un grand nombre d'echantillons d'apprentissage. La performance des classificateurs, selon
leur taux d'erreur median, est consistante pour la plupart des bases de donnees. Le PM et le
SVM obtiennent generalement les meilleurs taux de classification. Pour les problemes
comportant un grand nombre d'echantillons, notre approche obtient des resultats
encourageants.
Malgre la superiorite apparente de certains classificateurs, nos experimentations ne nous
permettent pas d'emettre une recommandation sur I'utilisation prioritaire d'un classificateur
dans tous les cas. Nous suggerons plutot I'utilisation d'une metaheuristique evolutive pour
I'analyse des donnees d'un probleme afin de choisir ou de combiner des classificateurs
appropries. Nous avan^ons egalement que la performance de classification de notre approche
pourrait etre amelioree par I'ajout de nouvelles caracteristiques pertinentes, puis par
I'optimisation des parametres des classificateurs en fonction des donnees |
---|