Suivi automatique de la main à partir de séquences vidéo monoculaires
Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'e...
Main Author: | |
---|---|
Language: | ENG |
Published: |
Ecole Centrale Paris
2009
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00619637 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf |
id |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00619637 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006196372013-01-07T17:35:00Z http://tel.archives-ouvertes.fr/tel-00619637 2009ECAP0045 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf Suivi automatique de la main à partir de séquences vidéo monoculaires De La Gorce, Martin [SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'ensemble des paramètres cinématiques nécessaires à la description de la configuration spatiale des différentes parties de la main. Cet ensemble de paramètres est composé des angles de chaque articulation ainsi que de la position et de l'orientation globale du poignet. Ce problème est un problème difficile. La main a de nombreux degrés de liberté et les auto-occultations sont omniprésentes, ce qui rend difficile l'estimation de la configuration des parties partiellement ou totalement cachées. Dans cette thèse sont proposées deux nouvelles méthodes qui améliorent par certains aspects l'état de l'art pour ce problème. Ces deux méthodes sont basées sur un modèle de la main dont la configuration spatiale est ajustée pour que sa projection dans l'image corresponde au mieux à l'image de main observée. Ce processus est guidé par une fonction de coût qui définit une mesure quantitative de la qualité de l'alignement de la projection du modèle avec l'image observée. La procédure d'ajustement du modèle est réalisée grâce à un raffinement itératif de type descente de gradient quasi-newton qui vise à minimiser cette fonction de coût.Les deux méthodes proposées diffèrent principalement par le choix du modèle et de la fonction du coût. La première méthode repose sur un modèle de la main composé d'ellipsoïdes et d'une fonction coût utilisant un modèle de la distribution statistique de la couleur la main et du fond de l'image.La seconde méthode repose sur un modèle triangulé de la surface de la main qui est texturé est ombragé. La fonction de coût mesure directement, pixel par pixel, la différence entre l'image observée et l'image synthétique obtenue par projection du modèle de la main dans l'image. Lors du calcul du gradient de la fonction de coût, une attention particulière a été portée aux termes dûs aux changements de visibilité de la surface au voisinage des auto-occultations, termes qui ont été négligés dans les méthodes préexistantes.Ces deux méthodes ne fonctionnement malheureusement pas en temps réel, ce qui rend leur utilisation pour l'instant impossible dans un contexte d'interaction homme-machine. L'amélioration de la performance des ordinateur combinée avec une amélioration de ces méthodes pourrait éventuellement permettre d'obtenir un résultat en temps réel. 2009-12-14 ENG PhD thesis Ecole Centrale Paris |
collection |
NDLTD |
language |
ENG |
sources |
NDLTD |
topic |
[SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations |
spellingShingle |
[SPI] Engineering Sciences Suivi de la main Modèle articulé Occultations De La Gorce, Martin Suivi automatique de la main à partir de séquences vidéo monoculaires |
description |
Dans cette thèse sont présentées deux méthodes visant à obtenir automatiquement une description tridimensionnelle des mouvements d'une main étant donnée une séquence vidéo monoculaire de cette main. En utilisant l'information fournie par la vidéo, l'objectif est de déterminer l'ensemble des paramètres cinématiques nécessaires à la description de la configuration spatiale des différentes parties de la main. Cet ensemble de paramètres est composé des angles de chaque articulation ainsi que de la position et de l'orientation globale du poignet. Ce problème est un problème difficile. La main a de nombreux degrés de liberté et les auto-occultations sont omniprésentes, ce qui rend difficile l'estimation de la configuration des parties partiellement ou totalement cachées. Dans cette thèse sont proposées deux nouvelles méthodes qui améliorent par certains aspects l'état de l'art pour ce problème. Ces deux méthodes sont basées sur un modèle de la main dont la configuration spatiale est ajustée pour que sa projection dans l'image corresponde au mieux à l'image de main observée. Ce processus est guidé par une fonction de coût qui définit une mesure quantitative de la qualité de l'alignement de la projection du modèle avec l'image observée. La procédure d'ajustement du modèle est réalisée grâce à un raffinement itératif de type descente de gradient quasi-newton qui vise à minimiser cette fonction de coût.Les deux méthodes proposées diffèrent principalement par le choix du modèle et de la fonction du coût. La première méthode repose sur un modèle de la main composé d'ellipsoïdes et d'une fonction coût utilisant un modèle de la distribution statistique de la couleur la main et du fond de l'image.La seconde méthode repose sur un modèle triangulé de la surface de la main qui est texturé est ombragé. La fonction de coût mesure directement, pixel par pixel, la différence entre l'image observée et l'image synthétique obtenue par projection du modèle de la main dans l'image. Lors du calcul du gradient de la fonction de coût, une attention particulière a été portée aux termes dûs aux changements de visibilité de la surface au voisinage des auto-occultations, termes qui ont été négligés dans les méthodes préexistantes.Ces deux méthodes ne fonctionnement malheureusement pas en temps réel, ce qui rend leur utilisation pour l'instant impossible dans un contexte d'interaction homme-machine. L'amélioration de la performance des ordinateur combinée avec une amélioration de ces méthodes pourrait éventuellement permettre d'obtenir un résultat en temps réel. |
author |
De La Gorce, Martin |
author_facet |
De La Gorce, Martin |
author_sort |
De La Gorce, Martin |
title |
Suivi automatique de la main à partir de séquences vidéo monoculaires |
title_short |
Suivi automatique de la main à partir de séquences vidéo monoculaires |
title_full |
Suivi automatique de la main à partir de séquences vidéo monoculaires |
title_fullStr |
Suivi automatique de la main à partir de séquences vidéo monoculaires |
title_full_unstemmed |
Suivi automatique de la main à partir de séquences vidéo monoculaires |
title_sort |
suivi automatique de la main à partir de séquences vidéo monoculaires |
publisher |
Ecole Centrale Paris |
publishDate |
2009 |
url |
http://tel.archives-ouvertes.fr/tel-00619637 http://tel.archives-ouvertes.fr/docs/00/61/96/37/PDF/Thesis_delagorce_arch.pdf |
work_keys_str_mv |
AT delagorcemartin suiviautomatiquedelamainapartirdesequencesvideomonoculaires |
_version_ |
1716396283409727488 |