Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics

Cette thèse est une collaboration entre le LAboratoire des Sciences et Matériaux pour l'Électronique et d'Automatique (LASMEA) de Clermont-Ferrand et le Laboratoire Vision et Ingénierie des Contenus (LVIC) du CEA LIST à Saclay. La première moitié de la thèse a été accomplie au sein de l�...

Full description

Bibliographic Details
Main Author: Luvison, Bertrand
Language:fra
Published: Université Blaise Pascal - Clermont-Ferrand II 2010
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00626490
http://tel.archives-ouvertes.fr/docs/00/62/64/90/PDF/2010CLF22089_-_LUVISON.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00626490
record_format oai_dc
collection NDLTD
language fra
sources NDLTD
topic [SPI] Engineering Sciences
[SPI] Sciences de l'ingénieur
Flot optique
Descripteurs spatio-temporels
Machine d'apprentissage
Fenêtre de Parzen
Modèle de Markov cachés
Classification du mouvement
spellingShingle [SPI] Engineering Sciences
[SPI] Sciences de l'ingénieur
Flot optique
Descripteurs spatio-temporels
Machine d'apprentissage
Fenêtre de Parzen
Modèle de Markov cachés
Classification du mouvement
Luvison, Bertrand
Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
description Cette thèse est une collaboration entre le LAboratoire des Sciences et Matériaux pour l'Électronique et d'Automatique (LASMEA) de Clermont-Ferrand et le Laboratoire Vision et Ingénierie des Contenus (LVIC) du CEA LIST à Saclay. La première moitié de la thèse a été accomplie au sein de l'équipe ComSee (1) du LASMEA et la deuxième au LVIC. L'objectif de ces travaux est de concevoir un système de vidéo-assistance temps réel pour la détection d'évènements dans des scènes possiblement denses.La vidéosurveillance intelligente de scènes denses telles que des foules est particulièrement difficile, principalement à cause de leur complexité et de la grande quantité de données à traiter simultanément. Le but de cette thèse consiste à élaborer une méthode de détection d'évènements rares dans de telles scènes, observées depuis une caméra fixe. La méthode en question s'appuie sur l'analyse automatique de mouvement et ne nécessite aucune information à priori. Les mouvements nominaux sont déterminés grâce à un apprentissage statistique non supervisé. Les plus fréquemment observés sont considérés comme des évènements normaux. Une phase de classification permet ensuite de détecter les mouvements déviant trop du modèle statistique, pour les considérer comme anormaux. Cette approche est particulièrement adaptée aux lieux de déplacements structurés, tels que des scènes de couloirs ou de carrefours routiers. Aucune étape de calibration, de segmentation de l'image, de détection d'objets ou de suivi n'est nécessaire. Contrairement aux analyses de trajectoires d'objets suivis, le coût calculatoire de notre méthode est invariante au nombre de cibles présentes en même temps et fonctionne en temps réel. Notre système s'appuie sur une classification locale du mouvement de la scène, sans calibration préalable. Dans un premier temps, une caractérisation du mouvement est réalisée, soit par des méthodes classiques de flot optique, soit par des descripteurs spatio-temporels. Ainsi, nous proposons un nouveau descripteur spatio-temporel fondé sur la recherche d'une relation linéaire entre les gradients spatiaux et les gradients temporels en des zones où le mouvement est supposé uniforme. Tout comme les algorithmes de flot optique, ce descripteur s'appuie sur la contrainte d'illumination constante.Cependant en prenant en compte un voisinage temporel plus important, il permet une caractérisation du mouvement plus lisse et plus robuste au bruit. De plus, sa faible complexité calculatoire est bien adaptée aux applications temps réel. Nous proposons ensuite d'étudier différentes méthodes de classification : La première, statique, dans un traitement image par image, s'appuie sur une estimation bayésienne de la caractérisation du mouvement au travers d'une approche basée sur les fenêtres de Parzen. Cette nouvelle méthode est une variante parcimonieuse des fenêtres de Parzen. Nous montrons que cette approche est algorithmiquement efficace pour approximer de manière compacte et précise les densités de probabilité. La seconde méthode, basée sur les réseaux bayésiens, permet de modéliser la dynamique du mouvement. Au lieu de considérer ce dernier image par image, des séquences de mouvements sont analysées au travers de chaînes de Markov Cachées. Ajouté à cela, une autre contribution de ce manuscrit est de prendre en compte la modélisation du voisinage d'un bloc afin d'ajouter une cohérence spatiale à la propagation du mouvement. Ceci est réalisé par le biais de couplages de chaînes de Markov cachées.Ces différentes approches statistiques ont été évaluées sur des données synthétiques ainsi qu'en situations réelles, aussi bien pour la surveillance du trafic routier que pour la surveillance de foule.Cette phase d'évaluation permet de donner des premières conclusions encourageantes quant à la faisabilité de la vidéosurveillance intelligente d'espaces possiblement denses.
author Luvison, Bertrand
author_facet Luvison, Bertrand
author_sort Luvison, Bertrand
title Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
title_short Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
title_full Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
title_fullStr Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
title_full_unstemmed Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
title_sort détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics
publisher Université Blaise Pascal - Clermont-Ferrand II
publishDate 2010
url http://tel.archives-ouvertes.fr/tel-00626490
http://tel.archives-ouvertes.fr/docs/00/62/64/90/PDF/2010CLF22089_-_LUVISON.pdf
work_keys_str_mv AT luvisonbertrand detectionnonsuperviseedevenementsraresdansunflotvideoapplicationalasurveillancedespacespublics
_version_ 1716716874789552128
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006264902014-10-14T03:30:44Z http://tel.archives-ouvertes.fr/tel-00626490 2010CLF22089 http://tel.archives-ouvertes.fr/docs/00/62/64/90/PDF/2010CLF22089_-_LUVISON.pdf Détection non supervisée d'évènements rares dans un flot vidéo : application à la surveillance d'espaces publics Luvison, Bertrand [SPI] Engineering Sciences [SPI] Sciences de l'ingénieur Flot optique Descripteurs spatio-temporels Machine d'apprentissage Fenêtre de Parzen Modèle de Markov cachés Classification du mouvement Cette thèse est une collaboration entre le LAboratoire des Sciences et Matériaux pour l'Électronique et d'Automatique (LASMEA) de Clermont-Ferrand et le Laboratoire Vision et Ingénierie des Contenus (LVIC) du CEA LIST à Saclay. La première moitié de la thèse a été accomplie au sein de l'équipe ComSee (1) du LASMEA et la deuxième au LVIC. L'objectif de ces travaux est de concevoir un système de vidéo-assistance temps réel pour la détection d'évènements dans des scènes possiblement denses.La vidéosurveillance intelligente de scènes denses telles que des foules est particulièrement difficile, principalement à cause de leur complexité et de la grande quantité de données à traiter simultanément. Le but de cette thèse consiste à élaborer une méthode de détection d'évènements rares dans de telles scènes, observées depuis une caméra fixe. La méthode en question s'appuie sur l'analyse automatique de mouvement et ne nécessite aucune information à priori. Les mouvements nominaux sont déterminés grâce à un apprentissage statistique non supervisé. Les plus fréquemment observés sont considérés comme des évènements normaux. Une phase de classification permet ensuite de détecter les mouvements déviant trop du modèle statistique, pour les considérer comme anormaux. Cette approche est particulièrement adaptée aux lieux de déplacements structurés, tels que des scènes de couloirs ou de carrefours routiers. Aucune étape de calibration, de segmentation de l'image, de détection d'objets ou de suivi n'est nécessaire. Contrairement aux analyses de trajectoires d'objets suivis, le coût calculatoire de notre méthode est invariante au nombre de cibles présentes en même temps et fonctionne en temps réel. Notre système s'appuie sur une classification locale du mouvement de la scène, sans calibration préalable. Dans un premier temps, une caractérisation du mouvement est réalisée, soit par des méthodes classiques de flot optique, soit par des descripteurs spatio-temporels. Ainsi, nous proposons un nouveau descripteur spatio-temporel fondé sur la recherche d'une relation linéaire entre les gradients spatiaux et les gradients temporels en des zones où le mouvement est supposé uniforme. Tout comme les algorithmes de flot optique, ce descripteur s'appuie sur la contrainte d'illumination constante.Cependant en prenant en compte un voisinage temporel plus important, il permet une caractérisation du mouvement plus lisse et plus robuste au bruit. De plus, sa faible complexité calculatoire est bien adaptée aux applications temps réel. Nous proposons ensuite d'étudier différentes méthodes de classification : La première, statique, dans un traitement image par image, s'appuie sur une estimation bayésienne de la caractérisation du mouvement au travers d'une approche basée sur les fenêtres de Parzen. Cette nouvelle méthode est une variante parcimonieuse des fenêtres de Parzen. Nous montrons que cette approche est algorithmiquement efficace pour approximer de manière compacte et précise les densités de probabilité. La seconde méthode, basée sur les réseaux bayésiens, permet de modéliser la dynamique du mouvement. Au lieu de considérer ce dernier image par image, des séquences de mouvements sont analysées au travers de chaînes de Markov Cachées. Ajouté à cela, une autre contribution de ce manuscrit est de prendre en compte la modélisation du voisinage d'un bloc afin d'ajouter une cohérence spatiale à la propagation du mouvement. Ceci est réalisé par le biais de couplages de chaînes de Markov cachées.Ces différentes approches statistiques ont été évaluées sur des données synthétiques ainsi qu'en situations réelles, aussi bien pour la surveillance du trafic routier que pour la surveillance de foule.Cette phase d'évaluation permet de donner des premières conclusions encourageantes quant à la faisabilité de la vidéosurveillance intelligente d'espaces possiblement denses. 2010-12-13 fra PhD thesis Université Blaise Pascal - Clermont-Ferrand II