Détection d'anomalies à la volée dans des flux de données de grande dimension

Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un...

Full description

Bibliographic Details
Main Author: Bellas, Anastasios
Language:FRE
Published: Université Panthéon-Sorbonne - Paris I 2014
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00944263
http://tel.archives-ouvertes.fr/docs/00/94/42/63/PDF/phd_main.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00944263
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009442632014-02-12T03:23:11Z http://tel.archives-ouvertes.fr/tel-00944263 http://tel.archives-ouvertes.fr/docs/00/94/42/63/PDF/phd_main.pdf Détection d'anomalies à la volée dans des flux de données de grande dimension Bellas, Anastasios [MATH:MATH_ST] Mathematics/Statistics [MATH:MATH_ST] Mathématiques/Statistiques [STAT:TH] Statistics/Statistics Theory [STAT:TH] Statistiques/Théorie Classification détection d'anomalies données de grande dimension flux de données trimming clustering online mélange de PPCA online cartes auto-organisatrices moteurs d'avions Health Monitoring Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un problème d'apprentissage non supervisée. Les données modernes, notamment celles issues de la surveillance des systèmes industriels sont souvent des flux d'observations de grande dimension, puisque plusieurs mesures sont prises à de hautes fréquences et à un horizon de temps qui peut être infini. De plus, les données peuvent contenir des anomalies (pannes) du système surveillé. La plupart des algorithmes existants ne peuvent pas traiter des données qui ont ces caractéristiques. Nous introduisons d'abord un algorithme de clustering probabiliste offline dans des sous-espaces pour des données de grande dimension qui repose sur l'algorithme d'espérance-maximisation (EM) et qui est, en plus, robuste aux anomalies grâce à la technique du trimming. Ensuite, nous nous intéressons à la question du clustering probabiliste online de flux de données de grande dimension en développant l'inférence online du modèle de mélange d'analyse en composantes principales probabiliste. Pour les deux méthodes proposées, nous montrons leur efficacité sur des données simulées et réelles, issues par exemple des moteurs d'avion. Enfin, nous développons une application intégrée pour le Health Monitoring des moteurs d'avion dans le but de détecter des anomalies de façon dynamique. Le système proposé introduit des techniques originales de détection et de visualisation d'anomalies reposant sur les cartes auto-organisatrices. Des résultats de détection sont présentés et la question de l'identification des anomalies est aussi discutée. 2014-01-28 FRE PhD thesis Université Panthéon-Sorbonne - Paris I
collection NDLTD
language FRE
sources NDLTD
topic [MATH:MATH_ST] Mathematics/Statistics
[MATH:MATH_ST] Mathématiques/Statistiques
[STAT:TH] Statistics/Statistics Theory
[STAT:TH] Statistiques/Théorie
Classification
détection d'anomalies
données de grande dimension
flux de données
trimming
clustering online
mélange de PPCA online
cartes auto-organisatrices
moteurs d'avions
Health Monitoring
spellingShingle [MATH:MATH_ST] Mathematics/Statistics
[MATH:MATH_ST] Mathématiques/Statistiques
[STAT:TH] Statistics/Statistics Theory
[STAT:TH] Statistiques/Théorie
Classification
détection d'anomalies
données de grande dimension
flux de données
trimming
clustering online
mélange de PPCA online
cartes auto-organisatrices
moteurs d'avions
Health Monitoring
Bellas, Anastasios
Détection d'anomalies à la volée dans des flux de données de grande dimension
description Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un problème d'apprentissage non supervisée. Les données modernes, notamment celles issues de la surveillance des systèmes industriels sont souvent des flux d'observations de grande dimension, puisque plusieurs mesures sont prises à de hautes fréquences et à un horizon de temps qui peut être infini. De plus, les données peuvent contenir des anomalies (pannes) du système surveillé. La plupart des algorithmes existants ne peuvent pas traiter des données qui ont ces caractéristiques. Nous introduisons d'abord un algorithme de clustering probabiliste offline dans des sous-espaces pour des données de grande dimension qui repose sur l'algorithme d'espérance-maximisation (EM) et qui est, en plus, robuste aux anomalies grâce à la technique du trimming. Ensuite, nous nous intéressons à la question du clustering probabiliste online de flux de données de grande dimension en développant l'inférence online du modèle de mélange d'analyse en composantes principales probabiliste. Pour les deux méthodes proposées, nous montrons leur efficacité sur des données simulées et réelles, issues par exemple des moteurs d'avion. Enfin, nous développons une application intégrée pour le Health Monitoring des moteurs d'avion dans le but de détecter des anomalies de façon dynamique. Le système proposé introduit des techniques originales de détection et de visualisation d'anomalies reposant sur les cartes auto-organisatrices. Des résultats de détection sont présentés et la question de l'identification des anomalies est aussi discutée.
author Bellas, Anastasios
author_facet Bellas, Anastasios
author_sort Bellas, Anastasios
title Détection d'anomalies à la volée dans des flux de données de grande dimension
title_short Détection d'anomalies à la volée dans des flux de données de grande dimension
title_full Détection d'anomalies à la volée dans des flux de données de grande dimension
title_fullStr Détection d'anomalies à la volée dans des flux de données de grande dimension
title_full_unstemmed Détection d'anomalies à la volée dans des flux de données de grande dimension
title_sort détection d'anomalies à la volée dans des flux de données de grande dimension
publisher Université Panthéon-Sorbonne - Paris I
publishDate 2014
url http://tel.archives-ouvertes.fr/tel-00944263
http://tel.archives-ouvertes.fr/docs/00/94/42/63/PDF/phd_main.pdf
work_keys_str_mv AT bellasanastasios detectiondanomaliesalavoleedansdesfluxdedonneesdegrandedimension
_version_ 1716637405942906880