Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher

Dans cette thèse, nous proposons des modèles et des méthodes dédiés à des taches de compréhension de l'image. En particulier, nous nous penchons sur des approches de type noyau de Fisher pour la classification d'images et la localisation d'objets. Nos études se répartissent en trois c...

Full description

Bibliographic Details
Main Author:	Cinbis, Ramazan Gokberk
Language:	fra
Published:	Université de Grenoble 2014
Subjects:	[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre [MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Classification d'image Détection d'objet Apprentissage faiblement supervisé Vision par ordinateur Apprentis-sage statistique
Online Access:	http://tel.archives-ouvertes.fr/tel-01071581 http://tel.archives-ouvertes.fr/docs/01/07/15/81/PDF/36307_CINBIS_2014_archivage.pdf

id	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-01071581
record_format	oai_dc
spelling	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-010715812014-10-14T03:26:38Z http://tel.archives-ouvertes.fr/tel-01071581 2014GRENM024 http://tel.archives-ouvertes.fr/docs/01/07/15/81/PDF/36307_CINBIS_2014_archivage.pdf Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher Cinbis, Ramazan Gokberk [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre [MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Classification d'image Détection d'objet Apprentissage faiblement supervisé Vision par ordinateur Apprentis-sage statistique Dans cette thèse, nous proposons des modèles et des méthodes dédiés à des taches de compréhension de l'image. En particulier, nous nous penchons sur des approches de type noyau de Fisher pour la classification d'images et la localisation d'objets. Nos études se répartissent en trois chapitres. En premier lieu, nous proposons de nouveaux descripteurs d'images construits sur des modèles non-iid de l'image. Notre point de départ est l'observation que les régions locales d'une image sont souvent supposées indépendentes et identiquement distribuées (iid) dans les modèles de type sacs-de-mots (SdM). Nous introduisons des modèles non-iid en traitant les paramètres du SdM comme des variables latentes, ce qui rend interdépendantes toutes les régions locales. En utilisant le noyau de Fisher, nous encodons une image par le gradient de sa log-vraisemblance par rapport aux hyper-paramètres du modèle. Notre représentation implique naturellement une invariance à certaines transformations, ce qui explique pourquoi de telles approches ont été courronnées de succès. En utilisant l'inférence variationnelle, nous étendons le modèle de base pour inclure un mélange de gaussiennes sur les descripteurs locaux, et un modèle latent de sujets pour capturer la structure co-occurente des mots visuels. Dans un second temps, nous présentons un système de détection d'objet reposant sur la représentation haute-dimension d'images par le vecteur de Fisher. Pour des raisons de complexité en temps et en espace, nous utilisons une méthode récente à base de segmentation pour engendrer des hypothèses de détection indépendantes des classes, ainsi que des techniques de compression. Notre principale contribution est une méthode pour produire des masques de segmentation potentiels, afin de supprimer le bruit du descripteur dû à l'arrière plan. Nous montrons que repondérer les descripteurs locaux de l'image en fonction de ces masques améliore significativement la performance en détection. Troisièmement, nous proposons une approche semi-supervisée pour la localisation d'objets. L'entrainement supervisé usuel de détecteurs d'objets nécessite l'annotation de boites englobantes des instances de ces objets. Ce processus coûteux est évité en apprentissage semi-supervisé, lequel ne nécessite que des étiquettes binaires indiquant la présence ou l'absence des objets. Nous suivons une approche d'apprentissage à instance multiple en alterne itérativement entre entrainer un détecteur et inférer les positions des objets. Notre contribution principale est une procédure multi-état d'apprentissage à instance multiple, qui évite à l'apprentissage de se focaliser prématurément sur des positions d'objets erronnées. Nous montrons que cette procédure est particulièrement importante lorsque des représentations haute-dimensions comme le vecteur de Fisher sont utilisées. Pour finir, nous présentons dans l'appendice de cette thèse notre travail sur l'identification de personnes dans des vidéos télévision non-contrôlées. Nous montrons qu'une distance adaptée au casting peut être apprise sans étiqueter d'exemple d'apprentissage, mais en utilisant des paires de visages au sein d'un même chemin et sur plusieurs chemins se chevauchant temporellement. Nous montrons que la métrique apprise améliore l'identification de chemins de visages, la reconnaissance et les performances en regroupement. 2014-07-22 fra PhD thesis Université de Grenoble
collection	NDLTD
language	fra
sources	NDLTD
topic	[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre [MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Classification d'image Détection d'objet Apprentissage faiblement supervisé Vision par ordinateur Apprentis-sage statistique
spellingShingle	[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre [MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Classification d'image Détection d'objet Apprentissage faiblement supervisé Vision par ordinateur Apprentis-sage statistique Cinbis, Ramazan Gokberk Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher
description	Dans cette thèse, nous proposons des modèles et des méthodes dédiés à des taches de compréhension de l'image. En particulier, nous nous penchons sur des approches de type noyau de Fisher pour la classification d'images et la localisation d'objets. Nos études se répartissent en trois chapitres. En premier lieu, nous proposons de nouveaux descripteurs d'images construits sur des modèles non-iid de l'image. Notre point de départ est l'observation que les régions locales d'une image sont souvent supposées indépendentes et identiquement distribuées (iid) dans les modèles de type sacs-de-mots (SdM). Nous introduisons des modèles non-iid en traitant les paramètres du SdM comme des variables latentes, ce qui rend interdépendantes toutes les régions locales. En utilisant le noyau de Fisher, nous encodons une image par le gradient de sa log-vraisemblance par rapport aux hyper-paramètres du modèle. Notre représentation implique naturellement une invariance à certaines transformations, ce qui explique pourquoi de telles approches ont été courronnées de succès. En utilisant l'inférence variationnelle, nous étendons le modèle de base pour inclure un mélange de gaussiennes sur les descripteurs locaux, et un modèle latent de sujets pour capturer la structure co-occurente des mots visuels. Dans un second temps, nous présentons un système de détection d'objet reposant sur la représentation haute-dimension d'images par le vecteur de Fisher. Pour des raisons de complexité en temps et en espace, nous utilisons une méthode récente à base de segmentation pour engendrer des hypothèses de détection indépendantes des classes, ainsi que des techniques de compression. Notre principale contribution est une méthode pour produire des masques de segmentation potentiels, afin de supprimer le bruit du descripteur dû à l'arrière plan. Nous montrons que repondérer les descripteurs locaux de l'image en fonction de ces masques améliore significativement la performance en détection. Troisièmement, nous proposons une approche semi-supervisée pour la localisation d'objets. L'entrainement supervisé usuel de détecteurs d'objets nécessite l'annotation de boites englobantes des instances de ces objets. Ce processus coûteux est évité en apprentissage semi-supervisé, lequel ne nécessite que des étiquettes binaires indiquant la présence ou l'absence des objets. Nous suivons une approche d'apprentissage à instance multiple en alterne itérativement entre entrainer un détecteur et inférer les positions des objets. Notre contribution principale est une procédure multi-état d'apprentissage à instance multiple, qui évite à l'apprentissage de se focaliser prématurément sur des positions d'objets erronnées. Nous montrons que cette procédure est particulièrement importante lorsque des représentations haute-dimensions comme le vecteur de Fisher sont utilisées. Pour finir, nous présentons dans l'appendice de cette thèse notre travail sur l'identification de personnes dans des vidéos télévision non-contrôlées. Nous montrons qu'une distance adaptée au casting peut être apprise sans étiqueter d'exemple d'apprentissage, mais en utilisant des paires de visages au sein d'un même chemin et sur plusieurs chemins se chevauchant temporellement. Nous montrons que la métrique apprise améliore l'identification de chemins de visages, la reconnaissance et les performances en regroupement.
author	Cinbis, Ramazan Gokberk
author_facet	Cinbis, Ramazan Gokberk
author_sort	Cinbis, Ramazan Gokberk
title	Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher
title_short	Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher
title_full	Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher
title_fullStr	Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher
title_full_unstemmed	Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher
title_sort	classification d'images et localisation d'objets par des méthodes de type noyau de fisher
publisher	Université de Grenoble
publishDate	2014
url	http://tel.archives-ouvertes.fr/tel-01071581 http://tel.archives-ouvertes.fr/docs/01/07/15/81/PDF/36307_CINBIS_2014_archivage.pdf
work_keys_str_mv	AT cinbisramazangokberk classificationdimagesetlocalisationdobjetspardesmethodesdetypenoyaudefisher
_version_	1716716790164226048

Classification d'images et localisation d'objets par des méthodes de type noyau de Fisher

Similar Items