Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge

Le travail de recherche de cette thèse de doctorat s'inscrit dans le cadre du suivi médical des patients atteints de démences liées à l'âge à l'aide des caméras videos portées par les patients. L'idée est de fournir aux médecins un nouvel outil pour le diagnostic précoce de démen...

Full description

Bibliographic Details
Main Author: Karaman, Svebor
Language:FRE
Published: Université Sciences et Technologies - Bordeaux I 2011
Subjects:
MMC
Online Access:http://tel.archives-ouvertes.fr/tel-00689855
http://tel.archives-ouvertes.fr/docs/00/68/98/55/PDF/theseSveborKaraman.pdf
http://tel.archives-ouvertes.fr/docs/00/68/98/55/ANNEX/thesisSveborKaraman.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00689855
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006898552013-01-07T16:57:46Z http://tel.archives-ouvertes.fr/tel-00689855 http://tel.archives-ouvertes.fr/docs/00/68/98/55/PDF/theseSveborKaraman.pdf http://tel.archives-ouvertes.fr/docs/00/68/98/55/ANNEX/thesisSveborKaraman.pdf Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge Karaman, Svebor [INFO:INFO_TS] Computer Science/Signal and Image Processing [SPI:SIGNAL] Engineering Sciences/Signal and Image processing [INFO:INFO_CV] Computer Science/Computer Vision and Pattern Recognition [INFO:INFO_TI] Computer Science/Image Processing [INFO:INFO_MM] Computer Science/Multimedia Indexation vidéo Vidéo portée Modèles de Markov Cachés MMC Activités Instrumentales du Quotidien IADL Mots-Graphes Graph Words Triangulation de Delaunay Sacs-de-Mots-Visuels Le travail de recherche de cette thèse de doctorat s'inscrit dans le cadre du suivi médical des patients atteints de démences liées à l'âge à l'aide des caméras videos portées par les patients. L'idée est de fournir aux médecins un nouvel outil pour le diagnostic précoce de démences liées à l'âge telles que la maladie d'Alzheimer. Plus précisément, les Activités Instrumentales du Quotidien (IADL : Instrumental Activities of Daily Living en anglais) doivent être indexées automatiquement dans les vidéos enregistrées par un dispositif d'enregistrement portable. Ces vidéos présentent des caractéristiques spécifiques comme de forts mouvements ou de forts changements de luminosité. De plus, la tâche de reconnaissance visée est d'un très haut niveau sémantique. Dans ce contexte difficile, la première étape d'analyse est la définition d'un équivalent à la notion de " plan " dans les contenus vidéos édités. Nous avons ainsi développé une méthode pour le partitionnement d'une vidéo tournée en continu en termes de " points de vue " à partir du mouvement apparent. Pour la reconnaissance des IADL, nous avons développé une solution selon le formalisme des Modèles de Markov Cachés (MMC). Un MMC hiérarchique à deux niveaux a été introduit, modélisant les activités sémantiques ou des états intermédiaires. Un ensemble complexe de descripteurs (dynamiques, statiques, de bas niveau et de niveau intermédiaire) a été exploité et les espaces de description joints optimaux ont été identifiés expérimentalement. Dans le cadre de descripteurs de niveau intermédiaire pour la reconnaissance d'activités nous nous sommes particulièrement intéressés aux objets sémantiques que la personne manipule dans le champ de la caméra. Nous avons proposé un nouveau concept pour la description d'objets ou d'images faisant usage des descripteurs locaux (SURF) et de la structure topologique sous-jacente de graphes locaux. Une approche imbriquée pour la construction des graphes où la même scène peut être décrite par plusieurs niveaux de graphes avec un nombre de nœuds croissant a été introduite. Nous construisons ces graphes par une triangulation de Delaunay sur des points SURF, préservant ainsi les bonnes propriétés des descripteurs locaux c'est-à-dire leur invariance vis-à-vis de transformations affines dans le plan image telles qu'une rotation, une translation ou un changement d'échelle. Nous utilisons ces graphes descripteurs dans le cadre de l'approche Sacs-de-Mots-Visuels. Le problème de définition d'une distance, ou dissimilarité, entre les graphes pour la classification non supervisée et la reconnaissance est nécessairement soulevé. Nous proposons une mesure de dissimilarité par le Noyau Dépendant du Contexte (Context-Dependent Kernel : CDK) proposé par H. Sahbi et montrons sa relation avec la norme classique L2 lors de la comparaison de graphes triviaux (les points SURF). Pour la reconnaissance d'activités par MMC, les expériences sont conduites sur le premier corpus au monde de vidéos avec caméra portée destiné à l'observation des d'IADL et sur des bases de données publiques comme SIVAL et Caltech-101 pour la reconnaissance d'objets. 2011-12-12 FRE PhD thesis Université Sciences et Technologies - Bordeaux I
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_TS] Computer Science/Signal and Image Processing
[SPI:SIGNAL] Engineering Sciences/Signal and Image processing
[INFO:INFO_CV] Computer Science/Computer Vision and Pattern Recognition
[INFO:INFO_TI] Computer Science/Image Processing
[INFO:INFO_MM] Computer Science/Multimedia
Indexation vidéo
Vidéo portée
Modèles de Markov Cachés
MMC
Activités Instrumentales du Quotidien
IADL
Mots-Graphes
Graph Words
Triangulation de Delaunay
Sacs-de-Mots-Visuels
spellingShingle [INFO:INFO_TS] Computer Science/Signal and Image Processing
[SPI:SIGNAL] Engineering Sciences/Signal and Image processing
[INFO:INFO_CV] Computer Science/Computer Vision and Pattern Recognition
[INFO:INFO_TI] Computer Science/Image Processing
[INFO:INFO_MM] Computer Science/Multimedia
Indexation vidéo
Vidéo portée
Modèles de Markov Cachés
MMC
Activités Instrumentales du Quotidien
IADL
Mots-Graphes
Graph Words
Triangulation de Delaunay
Sacs-de-Mots-Visuels
Karaman, Svebor
Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge
description Le travail de recherche de cette thèse de doctorat s'inscrit dans le cadre du suivi médical des patients atteints de démences liées à l'âge à l'aide des caméras videos portées par les patients. L'idée est de fournir aux médecins un nouvel outil pour le diagnostic précoce de démences liées à l'âge telles que la maladie d'Alzheimer. Plus précisément, les Activités Instrumentales du Quotidien (IADL : Instrumental Activities of Daily Living en anglais) doivent être indexées automatiquement dans les vidéos enregistrées par un dispositif d'enregistrement portable. Ces vidéos présentent des caractéristiques spécifiques comme de forts mouvements ou de forts changements de luminosité. De plus, la tâche de reconnaissance visée est d'un très haut niveau sémantique. Dans ce contexte difficile, la première étape d'analyse est la définition d'un équivalent à la notion de " plan " dans les contenus vidéos édités. Nous avons ainsi développé une méthode pour le partitionnement d'une vidéo tournée en continu en termes de " points de vue " à partir du mouvement apparent. Pour la reconnaissance des IADL, nous avons développé une solution selon le formalisme des Modèles de Markov Cachés (MMC). Un MMC hiérarchique à deux niveaux a été introduit, modélisant les activités sémantiques ou des états intermédiaires. Un ensemble complexe de descripteurs (dynamiques, statiques, de bas niveau et de niveau intermédiaire) a été exploité et les espaces de description joints optimaux ont été identifiés expérimentalement. Dans le cadre de descripteurs de niveau intermédiaire pour la reconnaissance d'activités nous nous sommes particulièrement intéressés aux objets sémantiques que la personne manipule dans le champ de la caméra. Nous avons proposé un nouveau concept pour la description d'objets ou d'images faisant usage des descripteurs locaux (SURF) et de la structure topologique sous-jacente de graphes locaux. Une approche imbriquée pour la construction des graphes où la même scène peut être décrite par plusieurs niveaux de graphes avec un nombre de nœuds croissant a été introduite. Nous construisons ces graphes par une triangulation de Delaunay sur des points SURF, préservant ainsi les bonnes propriétés des descripteurs locaux c'est-à-dire leur invariance vis-à-vis de transformations affines dans le plan image telles qu'une rotation, une translation ou un changement d'échelle. Nous utilisons ces graphes descripteurs dans le cadre de l'approche Sacs-de-Mots-Visuels. Le problème de définition d'une distance, ou dissimilarité, entre les graphes pour la classification non supervisée et la reconnaissance est nécessairement soulevé. Nous proposons une mesure de dissimilarité par le Noyau Dépendant du Contexte (Context-Dependent Kernel : CDK) proposé par H. Sahbi et montrons sa relation avec la norme classique L2 lors de la comparaison de graphes triviaux (les points SURF). Pour la reconnaissance d'activités par MMC, les expériences sont conduites sur le premier corpus au monde de vidéos avec caméra portée destiné à l'observation des d'IADL et sur des bases de données publiques comme SIVAL et Caltech-101 pour la reconnaissance d'objets.
author Karaman, Svebor
author_facet Karaman, Svebor
author_sort Karaman, Svebor
title Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge
title_short Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge
title_full Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge
title_fullStr Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge
title_full_unstemmed Indexation de la Vidéo Portée : Application à l'Étude Épidémiologique des Maladies Liées à l'Âge
title_sort indexation de la vidéo portée : application à l'étude épidémiologique des maladies liées à l'âge
publisher Université Sciences et Technologies - Bordeaux I
publishDate 2011
url http://tel.archives-ouvertes.fr/tel-00689855
http://tel.archives-ouvertes.fr/docs/00/68/98/55/PDF/theseSveborKaraman.pdf
http://tel.archives-ouvertes.fr/docs/00/68/98/55/ANNEX/thesisSveborKaraman.pdf
work_keys_str_mv AT karamansvebor indexationdelavideoporteeapplicationaletudeepidemiologiquedesmaladieslieesalage
_version_ 1716395557366267904