Détection d'anomalies à la volée dans des flux de données de grande dimension
Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un...
Main Author: | |
---|---|
Language: | FRE |
Published: |
Université Panthéon-Sorbonne - Paris I
2014
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00944263 http://tel.archives-ouvertes.fr/docs/00/94/42/63/PDF/phd_main.pdf |
id |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00944263 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009442632014-02-12T03:23:11Z http://tel.archives-ouvertes.fr/tel-00944263 http://tel.archives-ouvertes.fr/docs/00/94/42/63/PDF/phd_main.pdf Détection d'anomalies à la volée dans des flux de données de grande dimension Bellas, Anastasios [MATH:MATH_ST] Mathematics/Statistics [MATH:MATH_ST] Mathématiques/Statistiques [STAT:TH] Statistics/Statistics Theory [STAT:TH] Statistiques/Théorie Classification détection d'anomalies données de grande dimension flux de données trimming clustering online mélange de PPCA online cartes auto-organisatrices moteurs d'avions Health Monitoring Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un problème d'apprentissage non supervisée. Les données modernes, notamment celles issues de la surveillance des systèmes industriels sont souvent des flux d'observations de grande dimension, puisque plusieurs mesures sont prises à de hautes fréquences et à un horizon de temps qui peut être infini. De plus, les données peuvent contenir des anomalies (pannes) du système surveillé. La plupart des algorithmes existants ne peuvent pas traiter des données qui ont ces caractéristiques. Nous introduisons d'abord un algorithme de clustering probabiliste offline dans des sous-espaces pour des données de grande dimension qui repose sur l'algorithme d'espérance-maximisation (EM) et qui est, en plus, robuste aux anomalies grâce à la technique du trimming. Ensuite, nous nous intéressons à la question du clustering probabiliste online de flux de données de grande dimension en développant l'inférence online du modèle de mélange d'analyse en composantes principales probabiliste. Pour les deux méthodes proposées, nous montrons leur efficacité sur des données simulées et réelles, issues par exemple des moteurs d'avion. Enfin, nous développons une application intégrée pour le Health Monitoring des moteurs d'avion dans le but de détecter des anomalies de façon dynamique. Le système proposé introduit des techniques originales de détection et de visualisation d'anomalies reposant sur les cartes auto-organisatrices. Des résultats de détection sont présentés et la question de l'identification des anomalies est aussi discutée. 2014-01-28 FRE PhD thesis Université Panthéon-Sorbonne - Paris I |
collection |
NDLTD |
language |
FRE |
sources |
NDLTD |
topic |
[MATH:MATH_ST] Mathematics/Statistics [MATH:MATH_ST] Mathématiques/Statistiques [STAT:TH] Statistics/Statistics Theory [STAT:TH] Statistiques/Théorie Classification détection d'anomalies données de grande dimension flux de données trimming clustering online mélange de PPCA online cartes auto-organisatrices moteurs d'avions Health Monitoring |
spellingShingle |
[MATH:MATH_ST] Mathematics/Statistics [MATH:MATH_ST] Mathématiques/Statistiques [STAT:TH] Statistics/Statistics Theory [STAT:TH] Statistiques/Théorie Classification détection d'anomalies données de grande dimension flux de données trimming clustering online mélange de PPCA online cartes auto-organisatrices moteurs d'avions Health Monitoring Bellas, Anastasios Détection d'anomalies à la volée dans des flux de données de grande dimension |
description |
Le thème principal de cette thèse est d'étudier la détection d'anomalies dans des flux de données de grande dimension avec une application spécifique au \emph{Health Monitoring} des moteurs d'avion. Dans ce travail, on considère que le problème de la détection d'anomalies est un problème d'apprentissage non supervisée. Les données modernes, notamment celles issues de la surveillance des systèmes industriels sont souvent des flux d'observations de grande dimension, puisque plusieurs mesures sont prises à de hautes fréquences et à un horizon de temps qui peut être infini. De plus, les données peuvent contenir des anomalies (pannes) du système surveillé. La plupart des algorithmes existants ne peuvent pas traiter des données qui ont ces caractéristiques. Nous introduisons d'abord un algorithme de clustering probabiliste offline dans des sous-espaces pour des données de grande dimension qui repose sur l'algorithme d'espérance-maximisation (EM) et qui est, en plus, robuste aux anomalies grâce à la technique du trimming. Ensuite, nous nous intéressons à la question du clustering probabiliste online de flux de données de grande dimension en développant l'inférence online du modèle de mélange d'analyse en composantes principales probabiliste. Pour les deux méthodes proposées, nous montrons leur efficacité sur des données simulées et réelles, issues par exemple des moteurs d'avion. Enfin, nous développons une application intégrée pour le Health Monitoring des moteurs d'avion dans le but de détecter des anomalies de façon dynamique. Le système proposé introduit des techniques originales de détection et de visualisation d'anomalies reposant sur les cartes auto-organisatrices. Des résultats de détection sont présentés et la question de l'identification des anomalies est aussi discutée. |
author |
Bellas, Anastasios |
author_facet |
Bellas, Anastasios |
author_sort |
Bellas, Anastasios |
title |
Détection d'anomalies à la volée dans des flux de données de grande dimension |
title_short |
Détection d'anomalies à la volée dans des flux de données de grande dimension |
title_full |
Détection d'anomalies à la volée dans des flux de données de grande dimension |
title_fullStr |
Détection d'anomalies à la volée dans des flux de données de grande dimension |
title_full_unstemmed |
Détection d'anomalies à la volée dans des flux de données de grande dimension |
title_sort |
détection d'anomalies à la volée dans des flux de données de grande dimension |
publisher |
Université Panthéon-Sorbonne - Paris I |
publishDate |
2014 |
url |
http://tel.archives-ouvertes.fr/tel-00944263 http://tel.archives-ouvertes.fr/docs/00/94/42/63/PDF/phd_main.pdf |
work_keys_str_mv |
AT bellasanastasios detectiondanomaliesalavoleedansdesfluxdedonneesdegrandedimension |
_version_ |
1716637405942906880 |