Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)

Nous nous intéressons dans ce travail au problème de prévision de nouveaux liens dans des grands graphes de terrain. Nous explorons en particulier les approches topologiques dyadiques pour la prévision de liens. Différentes mesures de proximité topologique ont été étudiées dans la littérature pour p...

Full description

Bibliographic Details
Main Author: Pujari, Manisha
Other Authors: Sorbonne Paris Cité
Language:en
Published: 2015
Subjects:
Online Access:http://www.theses.fr/2015USPCD010/document
id ndltd-theses.fr-2015USPCD010
record_format oai_dc
spelling ndltd-theses.fr-2015USPCD0102017-07-11T04:46:00Z Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques) Link Prediction in Large-scale Complex Networks (Application to bibliographical Networks) Réseaux complexes Prévisions de liens Agrégation supervisée de préférences Analyse de réseaux multiplexes Complex networks Link prediction Supervised rank agregation Multiplex network analysis Nous nous intéressons dans ce travail au problème de prévision de nouveaux liens dans des grands graphes de terrain. Nous explorons en particulier les approches topologiques dyadiques pour la prévision de liens. Différentes mesures de proximité topologique ont été étudiées dans la littérature pour prédire l’apparition de nouveaux liens. Des techniques d’apprentissage supervisé ont été aussi utilisées afin de combiner ces différentes mesures pour construire des modèles prédictifs. Le problème d’apprentissage supervisé est ici un problème difficile à cause notamment du fort déséquilibre de classes. Dans cette thèse, nous explorons différentes approches alternatives pour améliorer les performances des approches dyadiques pour la prévision de liens. Nous proposons d’abord, une approche originale de combinaison des prévisions fondée sur des techniques d’agrégation supervisée de listes triées (ou agrégation de préférences). Nous explorons aussi différentes approches pour améliorer les performances des approches supervisées pour la prévision de liens. Une première approche consiste à étendre l’ensemble des attributs décrivant un exemple (paires de noeuds) par des attributs calculés dans un réseau multiplexe qui englobe le réseau cible. Un deuxième axe consiste à évaluer l’apport destechniques de détection de communautés pour l’échantillonnage des exemples. Des expérimentations menées sur des réseaux réels extraits de la base bibliographique DBLP montrent l’intérêt des approaches proposées. In this work, we are interested to tackle the problem of link prediction in complex networks. In particular, we explore topological dyadic approaches for link prediction. Different topological proximity measures have been studied in the scientific literature for finding the probability of appearance of new links in a complex network. Supervided learning methods have also been used to combine the predictions made or information provided by different topological measures. The create predictive models using various topological measures. The problem of supervised learning for link prediction is a difficult problem especially due to the presence of heavy class imbalance. In this thesis, we search different alternative approaches to improve the performance of different dyadic approaches for link prediction. We propose here, a new approach of link prediction based on supervised rank agregation that uses concepts from computational social choice theory. Our approach is founded on supervised techniques of aggregating sorted lists (or preference aggregation). We also explore different ways of improving supervised link prediction approaches. One approach is to extend the set of attributes describing an example (pair of nodes) by attributes calculated in a multiplex network that includes the target network. Multiplex networks have a layered structure, each layer having different kinds of links between same sets of nodes. The second way is to use community information for sampling of examples to deal with the problem of classe imabalance. Experiments conducted on real networks extracted from well known DBLP bibliographic database. Electronic Thesis or Dissertation Text en http://www.theses.fr/2015USPCD010/document Pujari, Manisha 2015-03-04 Sorbonne Paris Cité Rouveirol, Céline
collection NDLTD
language en
sources NDLTD
topic Réseaux complexes
Prévisions de liens
Agrégation supervisée de préférences
Analyse de réseaux multiplexes
Complex networks
Link prediction
Supervised rank agregation
Multiplex network analysis

spellingShingle Réseaux complexes
Prévisions de liens
Agrégation supervisée de préférences
Analyse de réseaux multiplexes
Complex networks
Link prediction
Supervised rank agregation
Multiplex network analysis

Pujari, Manisha
Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
description Nous nous intéressons dans ce travail au problème de prévision de nouveaux liens dans des grands graphes de terrain. Nous explorons en particulier les approches topologiques dyadiques pour la prévision de liens. Différentes mesures de proximité topologique ont été étudiées dans la littérature pour prédire l’apparition de nouveaux liens. Des techniques d’apprentissage supervisé ont été aussi utilisées afin de combiner ces différentes mesures pour construire des modèles prédictifs. Le problème d’apprentissage supervisé est ici un problème difficile à cause notamment du fort déséquilibre de classes. Dans cette thèse, nous explorons différentes approches alternatives pour améliorer les performances des approches dyadiques pour la prévision de liens. Nous proposons d’abord, une approche originale de combinaison des prévisions fondée sur des techniques d’agrégation supervisée de listes triées (ou agrégation de préférences). Nous explorons aussi différentes approches pour améliorer les performances des approches supervisées pour la prévision de liens. Une première approche consiste à étendre l’ensemble des attributs décrivant un exemple (paires de noeuds) par des attributs calculés dans un réseau multiplexe qui englobe le réseau cible. Un deuxième axe consiste à évaluer l’apport destechniques de détection de communautés pour l’échantillonnage des exemples. Des expérimentations menées sur des réseaux réels extraits de la base bibliographique DBLP montrent l’intérêt des approaches proposées. === In this work, we are interested to tackle the problem of link prediction in complex networks. In particular, we explore topological dyadic approaches for link prediction. Different topological proximity measures have been studied in the scientific literature for finding the probability of appearance of new links in a complex network. Supervided learning methods have also been used to combine the predictions made or information provided by different topological measures. The create predictive models using various topological measures. The problem of supervised learning for link prediction is a difficult problem especially due to the presence of heavy class imbalance. In this thesis, we search different alternative approaches to improve the performance of different dyadic approaches for link prediction. We propose here, a new approach of link prediction based on supervised rank agregation that uses concepts from computational social choice theory. Our approach is founded on supervised techniques of aggregating sorted lists (or preference aggregation). We also explore different ways of improving supervised link prediction approaches. One approach is to extend the set of attributes describing an example (pair of nodes) by attributes calculated in a multiplex network that includes the target network. Multiplex networks have a layered structure, each layer having different kinds of links between same sets of nodes. The second way is to use community information for sampling of examples to deal with the problem of classe imabalance. Experiments conducted on real networks extracted from well known DBLP bibliographic database.
author2 Sorbonne Paris Cité
author_facet Sorbonne Paris Cité
Pujari, Manisha
author Pujari, Manisha
author_sort Pujari, Manisha
title Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
title_short Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
title_full Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
title_fullStr Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
title_full_unstemmed Prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
title_sort prévision de liens dans des grands graphes de terrain (application aux réseaux bibliographiques)
publishDate 2015
url http://www.theses.fr/2015USPCD010/document
work_keys_str_mv AT pujarimanisha previsiondeliensdansdesgrandsgraphesdeterrainapplicationauxreseauxbibliographiques
AT pujarimanisha linkpredictioninlargescalecomplexnetworksapplicationtobibliographicalnetworks
_version_ 1718494985158918144