Techniques de l'intelligence artificielle pour la classification d'objets biologiques dans des images bidimensionnelles

La reconnaissance visuelle d'objets biologiques comme les produits agro-alimentaires et les especes vegetales en milieu naturel a profite de percees majeures lors des 30 dernieres annees. Aujourd'hui, des algorithmes de reconnaissance performants sont utilises pour evaluer la qualite de...

Full description

Bibliographic Details
Main Author: Levasseur, Yan
Format: Others
Published: École de technologie supérieure 2008
Online Access:http://espace.etsmtl.ca/115/1/LEVASSEUR_Yan.pdf
http://espace.etsmtl.ca/115/4/LEVASSEUR_Yan%2Dweb.pdf
Description
Summary:La reconnaissance visuelle d'objets biologiques comme les produits agro-alimentaires et les especes vegetales en milieu naturel a profite de percees majeures lors des 30 dernieres annees. Aujourd'hui, des algorithmes de reconnaissance performants sont utilises pour evaluer la qualite de productions agricoles et faire le suivi d'ecosysteme pour en assurer la protection. Dans la plupart des cas, ce sont des experts en vision et en informatique qui ont developpe les solutions personnalisees qui ont permis d'atteindre les resultats desires. L'objectif de la recherche presentee est de foumir des recommandations pour le developpement d'un algorithme de reconnaissance de formes dans des images qui soit generique et qui necessite le moins d'intervention humaine possible. Un tel algorithme pourrait etre utilise par les non experts, par exemple les ingenieurs en agro-alimentaire, les botanistes et les biologistes. Pour atteindre notre objectif, nous avons etudie les etapes du processus de reconnaissance a partir d'images. En pratique, nous avons mis sur pied un systeme de segmentation, d'extraction de caracteristiques et de classification, en plus d'avoir developpe un algorithme de Programmation Genetique (PG). Nous avons integre ce dernier au logiciel libre d'exploration des donnees Weka, afin d'encourager la mise en commun des efforts de recherche sur les algorithmes evolutionnaires. Les classificateurs utilises pour nos experimentations sont le classificateur naif de Bayes, I'arbre de decision C4.5, le K Plus Proche Voisins (KPPV), la PG, le Separateur a Vastes Marges (SVM) et le Perceptron Multicouche (PM). Dans une seconde serie d'experiences, nous avons combine chacun de ces classificateurs, a 1'exception du KPPV, au meta algorithme de boosting. Nous avons compare les resultats de classification des six algorithmes choisis pour six bases de donnees distinctes dont trois ont ete creees par nous. Les bases utilisees proviennent d'images de cereales, de grains de pollen, de noeuds de bois, de raisins sees, de feuilles d'arbres et de caracteres de I'alphabet romain. Suite a une segmentation des bases d'images, nous avons extrait, a partir de chaque objet, une quarantaine de caracteristiques. Une base de donnees alternatives a ete creee grace a la transformation par Analyse en Composante Principale (ACP). Finalement, nous avons compiles les resultats de classification des six classificateurs, puis de leur combinaison par boosting pour les caracteristiques de base et pour les caracteristiques transformees. Chaque experience a ete realisee 50 fois avec une separation aleatoire des bases d'apprentissage et de test. Nous avons observe de bonnes performances de classification pour les problemes comportant un grand nombre d'echantillons d'apprentissage. La performance des classificateurs, selon leur taux d'erreur median, est consistante pour la plupart des bases de donnees. Le PM et le SVM obtiennent generalement les meilleurs taux de classification. Pour les problemes comportant un grand nombre d'echantillons, notre approche obtient des resultats encourageants. Malgre la superiorite apparente de certains classificateurs, nos experimentations ne nous permettent pas d'emettre une recommandation sur I'utilisation prioritaire d'un classificateur dans tous les cas. Nous suggerons plutot I'utilisation d'une metaheuristique evolutive pour I'analyse des donnees d'un probleme afin de choisir ou de combiner des classificateurs appropries. Nous avan^ons egalement que la performance de classification de notre approche pourrait etre amelioree par I'ajout de nouvelles caracteristiques pertinentes, puis par I'optimisation des parametres des classificateurs en fonction des donnees