Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux

Les méthodes d'apprentissage semi-supervisé constituent une catégorie de méthodes d'apprentissage automatique qui combinent points étiquetés et données non labellisées pour construire le classifieur. Dans la première partie de la thèse, nous proposons un formalisme d'optimisation géné...

Full description

Bibliographic Details
Main Author: Sokol, Marina
Language:English
Published: Université Nice Sophia Antipolis 2014
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00998394
http://tel.archives-ouvertes.fr/docs/00/99/83/94/PDF/2014NICE4018.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00998394
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009983942014-06-03T03:33:29Z http://tel.archives-ouvertes.fr/tel-00998394 2014NICE4018 http://tel.archives-ouvertes.fr/docs/00/99/83/94/PDF/2014NICE4018.pdf Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux Sokol, Marina [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Apprentissage automatique Apprentissage semi-supervisé PageRank Mesures de centralité Classification dans les systèmes Pair-à-pair Les méthodes d'apprentissage semi-supervisé constituent une catégorie de méthodes d'apprentissage automatique qui combinent points étiquetés et données non labellisées pour construire le classifieur. Dans la première partie de la thèse, nous proposons un formalisme d'optimisation général, commun à l'ensemble des méthodes d'apprentissage semi-supervisé et en particulier aux Laplacien Standard, Laplacien Normalisé et PageRank. En utilisant la théorie des marches aléatoires, nous caractérisons les différences majeures entre méthodes d'apprentissage semi-supervisé et nous définissons des critères opérationnels pour guider le choix des paramètres du noyau ainsi que des points étiquetés. Nous illustrons la portée des résultats théoriques obtenus sur des données synthétiques et réelles, comme par exemple la classification par le contenu et par utilisateurs des systèmes pair-à-pair. Cette application montre de façon édifiante que la famille de méthodes proposée passe parfaitement à l'échelle. Les algorithmes développés dans la deuxième partie de la thèse peuvent être appliquées pour la sélection des données étiquetées, mais également aux autres applications dans la recherche d'information. Plus précisément, nous proposons des algorithmes randomisés pour la détection rapide des nœuds de grands degrés et des nœuds avec de grandes valeurs de PageRank personnalisé. A la fin de la thèse, nous proposons une nouvelle mesure de centralité, qui généralise à la fois la centralité d'intermédiarité et PageRank. Cette nouvelle mesure est particulièrement bien adaptée pour la détection de la vulnérabilité de réseau. 2014-04-29 eng PhD thesis Université Nice Sophia Antipolis
collection NDLTD
language English
sources NDLTD
topic [INFO:INFO_OH] Computer Science/Other
[INFO:INFO_OH] Informatique/Autre
Apprentissage automatique
Apprentissage semi-supervisé
PageRank
Mesures de centralité
Classification dans les systèmes Pair-à-pair
spellingShingle [INFO:INFO_OH] Computer Science/Other
[INFO:INFO_OH] Informatique/Autre
Apprentissage automatique
Apprentissage semi-supervisé
PageRank
Mesures de centralité
Classification dans les systèmes Pair-à-pair
Sokol, Marina
Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
description Les méthodes d'apprentissage semi-supervisé constituent une catégorie de méthodes d'apprentissage automatique qui combinent points étiquetés et données non labellisées pour construire le classifieur. Dans la première partie de la thèse, nous proposons un formalisme d'optimisation général, commun à l'ensemble des méthodes d'apprentissage semi-supervisé et en particulier aux Laplacien Standard, Laplacien Normalisé et PageRank. En utilisant la théorie des marches aléatoires, nous caractérisons les différences majeures entre méthodes d'apprentissage semi-supervisé et nous définissons des critères opérationnels pour guider le choix des paramètres du noyau ainsi que des points étiquetés. Nous illustrons la portée des résultats théoriques obtenus sur des données synthétiques et réelles, comme par exemple la classification par le contenu et par utilisateurs des systèmes pair-à-pair. Cette application montre de façon édifiante que la famille de méthodes proposée passe parfaitement à l'échelle. Les algorithmes développés dans la deuxième partie de la thèse peuvent être appliquées pour la sélection des données étiquetées, mais également aux autres applications dans la recherche d'information. Plus précisément, nous proposons des algorithmes randomisés pour la détection rapide des nœuds de grands degrés et des nœuds avec de grandes valeurs de PageRank personnalisé. A la fin de la thèse, nous proposons une nouvelle mesure de centralité, qui généralise à la fois la centralité d'intermédiarité et PageRank. Cette nouvelle mesure est particulièrement bien adaptée pour la détection de la vulnérabilité de réseau.
author Sokol, Marina
author_facet Sokol, Marina
author_sort Sokol, Marina
title Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
title_short Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
title_full Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
title_fullStr Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
title_full_unstemmed Méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
title_sort méthodes d'apprentissage semi-supervisé basé sur les graphes et détection rapide des nœuds centraux
publisher Université Nice Sophia Antipolis
publishDate 2014
url http://tel.archives-ouvertes.fr/tel-00998394
http://tel.archives-ouvertes.fr/docs/00/99/83/94/PDF/2014NICE4018.pdf
work_keys_str_mv AT sokolmarina methodesdapprentissagesemisupervisebasesurlesgraphesetdetectionrapidedesnœudscentraux
_version_ 1716668004023926784