Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications

Le ranking multipartite est un problème d'apprentissage statistique qui consiste à ordonner les observations qui appartiennent à un espace de grande dimension dans le même ordre que les labels, de sorte que les observations avec le label le plus élevé apparaissent en haut de la liste. Cette thè...

Full description

Bibliographic Details
Main Author: Robbiano, Sylvain
Other Authors: Paris, ENST
Language:en
fr
Published: 2013
Subjects:
Online Access:http://www.theses.fr/2013ENST0033/document
id ndltd-theses.fr-2013ENST0033
record_format oai_dc
spelling ndltd-theses.fr-2013ENST00332019-12-22T04:46:24Z Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications Statistical learning methods for ranking : theory, algorithms and applications Ranking multipartite Surface ROC Tau de Kendall Ranking multipartite Surface ROC Kendall rank correlation coefficient Le ranking multipartite est un problème d'apprentissage statistique qui consiste à ordonner les observations qui appartiennent à un espace de grande dimension dans le même ordre que les labels, de sorte que les observations avec le label le plus élevé apparaissent en haut de la liste. Cette thèse vise à comprendre la nature probabiliste du problème de ranking multipartite afin d'obtenir des garanties théoriques pour les algorithmes de ranking. Dans ce cadre, la sortie d'un algorithme de ranking prend la forme d'une fonction de scoring, une fonction qui envoie l'espace des observations sur la droite réelle et l'ordre finale est construit en utilisant l'ordre induit par la droite réelle. Les contributions de ce manuscrit sont les suivantes : d'abord, nous nous concentrons sur la caractérisation des solutions optimales de ranking multipartite. Le deuxième thème de recherche est la conception d'algorithmes pour produire des fonctions de scoring. Nous proposons deux méthodes, la première utilisant une procédure d'agrégation, la deuxième un schema d'approximation. Enfin, nous revenons au problème de ranking binaire afin d'établir des vitesse minimax adaptives de convergences. Multipartite ranking is a statistical learning problem that consists in ordering observations that belong to a high dimensional feature space in the same order as the labels, so that the observations with the highest label appear at the top of the list. This work aims to understand the probabilistic nature of the multipartite ranking problem in order to obtain theoretical guarantees for ranking algorithms. In this context, the output of a ranking algorithm takes the form of a scoring function, a function that maps the space of the observation to the real line which order is induced using the values on the real line. The contributions of this manuscript are the following : First, we focus on the characterization of optimal solutions to multipartite ranking. The second research theme is the design of algorithms to produce scoring functions. We offer two methods, the first using an aggregation procedure, the second an approximation scheme. Finally, we return to the binary ranking problem to establish adaptive minimax rate of convergence. Electronic Thesis or Dissertation Text en fr http://www.theses.fr/2013ENST0033/document Robbiano, Sylvain 2013-06-19 Paris, ENST Clémençon, Stéphan
collection NDLTD
language en
fr
sources NDLTD
topic Ranking multipartite
Surface ROC
Tau de Kendall
Ranking multipartite
Surface ROC
Kendall rank correlation coefficient

spellingShingle Ranking multipartite
Surface ROC
Tau de Kendall
Ranking multipartite
Surface ROC
Kendall rank correlation coefficient

Robbiano, Sylvain
Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
description Le ranking multipartite est un problème d'apprentissage statistique qui consiste à ordonner les observations qui appartiennent à un espace de grande dimension dans le même ordre que les labels, de sorte que les observations avec le label le plus élevé apparaissent en haut de la liste. Cette thèse vise à comprendre la nature probabiliste du problème de ranking multipartite afin d'obtenir des garanties théoriques pour les algorithmes de ranking. Dans ce cadre, la sortie d'un algorithme de ranking prend la forme d'une fonction de scoring, une fonction qui envoie l'espace des observations sur la droite réelle et l'ordre finale est construit en utilisant l'ordre induit par la droite réelle. Les contributions de ce manuscrit sont les suivantes : d'abord, nous nous concentrons sur la caractérisation des solutions optimales de ranking multipartite. Le deuxième thème de recherche est la conception d'algorithmes pour produire des fonctions de scoring. Nous proposons deux méthodes, la première utilisant une procédure d'agrégation, la deuxième un schema d'approximation. Enfin, nous revenons au problème de ranking binaire afin d'établir des vitesse minimax adaptives de convergences. === Multipartite ranking is a statistical learning problem that consists in ordering observations that belong to a high dimensional feature space in the same order as the labels, so that the observations with the highest label appear at the top of the list. This work aims to understand the probabilistic nature of the multipartite ranking problem in order to obtain theoretical guarantees for ranking algorithms. In this context, the output of a ranking algorithm takes the form of a scoring function, a function that maps the space of the observation to the real line which order is induced using the values on the real line. The contributions of this manuscript are the following : First, we focus on the characterization of optimal solutions to multipartite ranking. The second research theme is the design of algorithms to produce scoring functions. We offer two methods, the first using an aggregation procedure, the second an approximation scheme. Finally, we return to the binary ranking problem to establish adaptive minimax rate of convergence.
author2 Paris, ENST
author_facet Paris, ENST
Robbiano, Sylvain
author Robbiano, Sylvain
author_sort Robbiano, Sylvain
title Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
title_short Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
title_full Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
title_fullStr Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
title_full_unstemmed Méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
title_sort méthodes d'apprentissage statistique pour le ranking : théorie, algorithmes et applications
publishDate 2013
url http://www.theses.fr/2013ENST0033/document
work_keys_str_mv AT robbianosylvain methodesdapprentissagestatistiquepourlerankingtheoriealgorithmesetapplications
AT robbianosylvain statisticallearningmethodsforrankingtheoryalgorithmsandapplications
_version_ 1719305720593121280