Estimation robuste des modèles de mélange sur des données distribuées

Cette thèse propose une contribution en matière d'analyse de données, dans la perspective de systèmes informatiques distribués non-centralisés, pour le partage de données numériques. De tels systèmes se développent en particulier sur internet, possiblement à large échelle, mais aussi, par exemp...

Full description

Bibliographic Details
Main Author:	El Attar, Ali
Language:	FRE
Published:	Université de Nantes 2012
Subjects:	[INFO:INFO_LG] Computer Science/Learning clustering modèle de mélange agrégation des modèles des mélanges estimation robuste détection de données atypiques données distribuées
Online Access:	http://tel.archives-ouvertes.fr/tel-00746118 http://tel.archives-ouvertes.fr/docs/00/74/61/18/PDF/thesefinalecorrigA_e.pdf

Description
Summary:	Cette thèse propose une contribution en matière d'analyse de données, dans la perspective de systèmes informatiques distribués non-centralisés, pour le partage de données numériques. De tels systèmes se développent en particulier sur internet, possiblement à large échelle, mais aussi, par exemple, par des réseaux de capteurs. Notre objectif général est d'estimer la distribution de probabilité d'un jeu de données distribuées, à partir d'estimations locales de cette distribution, calculées sur des sous- jeux de données locaux. En d'autres termes, il s'est agi de proposer une technique pour agréger des estimés locaux pour en faire un estimé global. Notre proposition s'appuie sur la forme particulière que doivent prendre toutes les distributions de probabilité manipulées : elles doivent se formuler comme un mélange de lois gaussiennes multivariées. Notre contribution est une solution à la fois décentralisée et statistiquement robuste aux modèles locaux aberrants, pour mener à bien l'agrégation globale, à partir d'agrégations locales de mélanges de lois gaussiennes. Ces agrégations locales ne requièrent un accès qu'aux seuls paramètres des modèles de mélanges, et non aux données originales.

Estimation robuste des modèles de mélange sur des données distribuées

Similar Items