Suivi automatique de la main à partir de séquences vidéo monoculaires

Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'e...

Full description

Bibliographic Details
Main Author: De La Gorce, Martin
Language:ENG
Published: Ecole Centrale Paris 2009
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00619637
http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00619637
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006196372013-01-07T17:35:00Z http://tel.archives-ouvertes.fr/tel-00619637 2009ECAP0045 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf Suivi automatique de la main à partir de séquences vidéo monoculaires De La Gorce, Martin [SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'ensemble des paramètres cinématiques nécessaires à la description de la configuration spatiale des différentes parties de la main. Cet ensemble de paramètres est composé des angles de chaque articulation ainsi que de la position et de l'orientation globale du poignet. Ce problème est un problème difficile. La main a de nombreux degrés de liberté et les auto-occultations sont omniprésentes, ce qui rend difficile l'estimation de la configuration des parties partiellement ou totalement cachées. Dans cette thèse sont proposées deux nouvelles méthodes qui améliorent par certains aspects l'état de l'art pour ce problème. Ces deux méthodes sont basées sur un modèle de la main dont la configuration spatiale est ajustée pour que sa projection dans l'image corresponde au mieux à l'image de main observée. Ce processus est guidé par une fonction de coût qui définit une mesure quantitative de la qualité de l'alignement de la projection du modèle avec l'image observée. La procédure d'ajustement du modèle est réalisée grâce à un raffinement itératif de type descente de gradient quasi-newton qui vise à minimiser cette fonction de coût.Les deux méthodes proposées diffèrent principalement par le choix du modèle et de la fonction du coût. La première méthode repose sur un modèle de la main composé d'ellipsoïdes et d'une fonction coût utilisant un modèle de la distribution statistique de la couleur la main et du fond de l'image.La seconde méthode repose sur un modèle triangulé de la surface de la main qui est texturé est ombragé. La fonction de coût mesure directement, pixel par pixel, la différence entre l'image observée et l'image synthétique obtenue par projection du modèle de la main dans l'image. Lors du calcul du gradient de la fonction de coût, une attention particulière a été portée aux termes dûs aux changements de visibilité de la surface au voisinage des auto-occultations, termes qui ont été négligés dans les méthodes préexistantes.Ces deux méthodes ne fonctionnement malheureusement pas en temps réel, ce qui rend leur utilisation pour l'instant impossible dans un contexte d'interaction homme-machine. L'amélioration de la performance des ordinateur combinée avec une amélioration de ces méthodes pourrait éventuellement permettre d'obtenir un résultat en temps réel. 2009-12-14 ENG PhD thesis Ecole Centrale Paris
collection NDLTD
language ENG
sources NDLTD
topic [SPI] Engineering Sciences
Suivi de la main
Modèle articulé
Occultations
spellingShingle [SPI] Engineering Sciences
Suivi de la main
Modèle articulé
Occultations
De La Gorce, Martin
Suivi automatique de la main à partir de séquences vidéo monoculaires
description Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'ensemble des paramètres cinématiques nécessaires à la description de la configuration spatiale des différentes parties de la main. Cet ensemble de paramètres est composé des angles de chaque articulation ainsi que de la position et de l'orientation globale du poignet. Ce problème est un problème difficile. La main a de nombreux degrés de liberté et les auto-occultations sont omniprésentes, ce qui rend difficile l'estimation de la configuration des parties partiellement ou totalement cachées. Dans cette thèse sont proposées deux nouvelles méthodes qui améliorent par certains aspects l'état de l'art pour ce problème. Ces deux méthodes sont basées sur un modèle de la main dont la configuration spatiale est ajustée pour que sa projection dans l'image corresponde au mieux à l'image de main observée. Ce processus est guidé par une fonction de coût qui définit une mesure quantitative de la qualité de l'alignement de la projection du modèle avec l'image observée. La procédure d'ajustement du modèle est réalisée grâce à un raffinement itératif de type descente de gradient quasi-newton qui vise à minimiser cette fonction de coût.Les deux méthodes proposées diffèrent principalement par le choix du modèle et de la fonction du coût. La première méthode repose sur un modèle de la main composé d'ellipsoïdes et d'une fonction coût utilisant un modèle de la distribution statistique de la couleur la main et du fond de l'image.La seconde méthode repose sur un modèle triangulé de la surface de la main qui est texturé est ombragé. La fonction de coût mesure directement, pixel par pixel, la différence entre l'image observée et l'image synthétique obtenue par projection du modèle de la main dans l'image. Lors du calcul du gradient de la fonction de coût, une attention particulière a été portée aux termes dûs aux changements de visibilité de la surface au voisinage des auto-occultations, termes qui ont été négligés dans les méthodes préexistantes.Ces deux méthodes ne fonctionnement malheureusement pas en temps réel, ce qui rend leur utilisation pour l'instant impossible dans un contexte d'interaction homme-machine. L'amélioration de la performance des ordinateur combinée avec une amélioration de ces méthodes pourrait éventuellement permettre d'obtenir un résultat en temps réel.
author De La Gorce, Martin
author_facet De La Gorce, Martin
author_sort De La Gorce, Martin
title Suivi automatique de la main à partir de séquences vidéo monoculaires
title_short Suivi automatique de la main à partir de séquences vidéo monoculaires
title_full Suivi automatique de la main à partir de séquences vidéo monoculaires
title_fullStr Suivi automatique de la main à partir de séquences vidéo monoculaires
title_full_unstemmed Suivi automatique de la main à partir de séquences vidéo monoculaires
title_sort suivi automatique de la main à partir de séquences vidéo monoculaires
publisher Ecole Centrale Paris
publishDate 2009
url http://tel.archives-ouvertes.fr/tel-00619637
http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf
work_keys_str_mv AT delagorcemartin suiviautomatiquedelamainapartirdesequencesvideomonoculaires
_version_ 1716396283409727488