Suivi automatique de la main à partir de séquences vidéo monoculaires

Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'e...

Full description

Bibliographic Details
Main Author:	De La Gorce, Martin
Language:	ENG
Published:	Ecole Centrale Paris 2009
Subjects:	[SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations
Online Access:	http://tel.archives-ouvertes.fr/tel-00619637 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf

id	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00619637
record_format	oai_dc
spelling	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006196372013-01-07T17:35:00Z http://tel.archives-ouvertes.fr/tel-00619637 2009ECAP0045 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf Suivi automatique de la main à partir de séquences vidéo monoculaires De La Gorce, Martin [SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'ensemble des paramètres cinématiques nécessaires à la description de la configuration spatiale des différentes parties de la main. Cet ensemble de paramètres est composé des angles de chaque articulation ainsi que de la position et de l'orientation globale du poignet. Ce problème est un problème difficile. La main a de nombreux degrés de liberté et les auto-occultations sont omniprésentes, ce qui rend difficile l'estimation de la configuration des parties partiellement ou totalement cachées. Dans cette thèse sont proposées deux nouvelles méthodes qui améliorent par certains aspects l'état de l'art pour ce problème. Ces deux méthodes sont basées sur un modèle de la main dont la configuration spatiale est ajustée pour que sa projection dans l'image corresponde au mieux à l'image de main observée. Ce processus est guidé par une fonction de coût qui définit une mesure quantitative de la qualité de l'alignement de la projection du modèle avec l'image observée. La procédure d'ajustement du modèle est réalisée grâce à un raffinement itératif de type descente de gradient quasi-newton qui vise à minimiser cette fonction de coût.Les deux méthodes proposées diffèrent principalement par le choix du modèle et de la fonction du coût. La première méthode repose sur un modèle de la main composé d'ellipsoïdes et d'une fonction coût utilisant un modèle de la distribution statistique de la couleur la main et du fond de l'image.La seconde méthode repose sur un modèle triangulé de la surface de la main qui est texturé est ombragé. La fonction de coût mesure directement, pixel par pixel, la différence entre l'image observée et l'image synthétique obtenue par projection du modèle de la main dans l'image. Lors du calcul du gradient de la fonction de coût, une attention particulière a été portée aux termes dûs aux changements de visibilité de la surface au voisinage des auto-occultations, termes qui ont été négligés dans les méthodes préexistantes.Ces deux méthodes ne fonctionnement malheureusement pas en temps réel, ce qui rend leur utilisation pour l'instant impossible dans un contexte d'interaction homme-machine. L'amélioration de la performance des ordinateur combinée avec une amélioration de ces méthodes pourrait éventuellement permettre d'obtenir un résultat en temps réel. 2009-12-14 ENG PhD thesis Ecole Centrale Paris
collection	NDLTD
language	ENG
sources	NDLTD
topic	[SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations
spellingShingle	[SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations De La Gorce, Martin Suivi automatique de la main à partir de séquences vidéo monoculaires
description	Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'ensemble des paramètres cinématiques nécessaires à la description de la configuration spatiale des différentes parties de la main. Cet ensemble de paramètres est composé des angles de chaque articulation ainsi que de la position et de l'orientation globale du poignet. Ce problème est un problème difficile. La main a de nombreux degrés de liberté et les auto-occultations sont omniprésentes, ce qui rend difficile l'estimation de la configuration des parties partiellement ou totalement cachées. Dans cette thèse sont proposées deux nouvelles méthodes qui améliorent par certains aspects l'état de l'art pour ce problème. Ces deux méthodes sont basées sur un modèle de la main dont la configuration spatiale est ajustée pour que sa projection dans l'image corresponde au mieux à l'image de main observée. Ce processus est guidé par une fonction de coût qui définit une mesure quantitative de la qualité de l'alignement de la projection du modèle avec l'image observée. La procédure d'ajustement du modèle est réalisée grâce à un raffinement itératif de type descente de gradient quasi-newton qui vise à minimiser cette fonction de coût.Les deux méthodes proposées diffèrent principalement par le choix du modèle et de la fonction du coût. La première méthode repose sur un modèle de la main composé d'ellipsoïdes et d'une fonction coût utilisant un modèle de la distribution statistique de la couleur la main et du fond de l'image.La seconde méthode repose sur un modèle triangulé de la surface de la main qui est texturé est ombragé. La fonction de coût mesure directement, pixel par pixel, la différence entre l'image observée et l'image synthétique obtenue par projection du modèle de la main dans l'image. Lors du calcul du gradient de la fonction de coût, une attention particulière a été portée aux termes dûs aux changements de visibilité de la surface au voisinage des auto-occultations, termes qui ont été négligés dans les méthodes préexistantes.Ces deux méthodes ne fonctionnement malheureusement pas en temps réel, ce qui rend leur utilisation pour l'instant impossible dans un contexte d'interaction homme-machine. L'amélioration de la performance des ordinateur combinée avec une amélioration de ces méthodes pourrait éventuellement permettre d'obtenir un résultat en temps réel.
author	De La Gorce, Martin
author_facet	De La Gorce, Martin
author_sort	De La Gorce, Martin
title	Suivi automatique de la main à partir de séquences vidéo monoculaires
title_short	Suivi automatique de la main à partir de séquences vidéo monoculaires
title_full	Suivi automatique de la main à partir de séquences vidéo monoculaires
title_fullStr	Suivi automatique de la main à partir de séquences vidéo monoculaires
title_full_unstemmed	Suivi automatique de la main à partir de séquences vidéo monoculaires
title_sort	suivi automatique de la main à partir de séquences vidéo monoculaires
publisher	Ecole Centrale Paris
publishDate	2009
url	http://tel.archives-ouvertes.fr/tel-00619637 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf
work_keys_str_mv	AT delagorcemartin suiviautomatiquedelamainapartirdesequencesvideomonoculaires
_version_	1716396283409727488

Suivi automatique de la main à partir de séquences vidéo monoculaires

Similar Items