Sélection de modèle : une approche décisionnelle

Cette thèse s'articule autour de la problématique de la sélection de modèle, étudiée dans le contexte de la régression linéaire. L'objectif est de déterminer le meilleur modèle de prédiction à partir de données mesurées, c'est-à-dire le modèle réalisant le meilleur compromis entre att...

Full description

Bibliographic Details
Main Author: Boisbunon, Aurélie
Language:ENG
Published: Université de Rouen 2013
Subjects:
MCP
Online Access:http://tel.archives-ouvertes.fr/tel-00793898
http://tel.archives-ouvertes.fr/docs/00/79/38/98/PDF/theseBoisbunon.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00793898
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-007938982013-03-04T15:03:03Z http://tel.archives-ouvertes.fr/tel-00793898 http://tel.archives-ouvertes.fr/docs/00/79/38/98/PDF/theseBoisbunon.pdf Sélection de modèle : une approche décisionnelle Boisbunon, Aurélie [STAT:TH] Statistics/Statistics Theory [STAT:ML] Statistics/Machine Learning sélection de modèle sélection de variable régression linéaire estimation de coût distributions à symétrie sphérique dépendance Lasso MCP Cette thèse s'articule autour de la problématique de la sélection de modèle, étudiée dans le contexte de la régression linéaire. L'objectif est de déterminer le meilleur modèle de prédiction à partir de données mesurées, c'est-à-dire le modèle réalisant le meilleur compromis entre attache aux données et complexité du modèle. La contribution principale consiste en la dérivation de critères d'évaluation de modèles basés sur des techniques de théorie de la décision, plus précisément l'estimation de coût. Ces critères reposent sur une hypothèse distributionnelle plus large que l'hypothèse classique gaussienne avec indépendance entre les observations : la famille des lois à symétrie sphérique. Cette famille nous permet à la fois de nous affranchir de l'hypothèse d'indépendance et d'ajouter une plus grande robustesse puisque nos critères ne dépendent pas de la forme spécifique de la distribution. Nous proposons également une méthode de comparaison des critères dérivés au travers d'une mesure de type Erreur quadratique (MSE), qui permet de déterminer si un critère d'évaluation de modèle est meilleur qu'un autre. La seconde contribution attaque le problème de la construction des différents modèles comparés. Les collections de modèles considérées sont celles issues des méthodes de régularisation parcimonieuses, de type Lasso. En particulier, nous nous sommes intéressés à la Pénalité Concave Minimax (MCP), qui garde la sélection du Lasso tout en corrigeant son biais d'estimation. Cette pénalité correspond cependant à un problème non différentiable et non convexe. La généralisation des outils habituels de sous-différentielles grâce aux différentielles de Clarke a permis de déterminer les conditions d'optimalité et de développer un algorithme de chemin de régularisation pour le MCP. Enfin, nous comparons nos propositions avec celles de la littérature au travers d'une étude numérique, dans laquelle nous vérifions la qualité de la sélection. Les résultats montrent notamment que nos critères obtiennent des performances comparables à ceux de la littérature, et que les critères les plus couramment utilisés en pratique (validation croisée) ne sont pas toujours parmi les plus performants. 2013-01-14 ENG PhD thesis Université de Rouen
collection NDLTD
language ENG
sources NDLTD
topic [STAT:TH] Statistics/Statistics Theory
[STAT:ML] Statistics/Machine Learning
sélection de modèle
sélection de variable
régression linéaire
estimation de coût
distributions à symétrie sphérique
dépendance
Lasso
MCP
spellingShingle [STAT:TH] Statistics/Statistics Theory
[STAT:ML] Statistics/Machine Learning
sélection de modèle
sélection de variable
régression linéaire
estimation de coût
distributions à symétrie sphérique
dépendance
Lasso
MCP
Boisbunon, Aurélie
Sélection de modèle : une approche décisionnelle
description Cette thèse s'articule autour de la problématique de la sélection de modèle, étudiée dans le contexte de la régression linéaire. L'objectif est de déterminer le meilleur modèle de prédiction à partir de données mesurées, c'est-à-dire le modèle réalisant le meilleur compromis entre attache aux données et complexité du modèle. La contribution principale consiste en la dérivation de critères d'évaluation de modèles basés sur des techniques de théorie de la décision, plus précisément l'estimation de coût. Ces critères reposent sur une hypothèse distributionnelle plus large que l'hypothèse classique gaussienne avec indépendance entre les observations : la famille des lois à symétrie sphérique. Cette famille nous permet à la fois de nous affranchir de l'hypothèse d'indépendance et d'ajouter une plus grande robustesse puisque nos critères ne dépendent pas de la forme spécifique de la distribution. Nous proposons également une méthode de comparaison des critères dérivés au travers d'une mesure de type Erreur quadratique (MSE), qui permet de déterminer si un critère d'évaluation de modèle est meilleur qu'un autre. La seconde contribution attaque le problème de la construction des différents modèles comparés. Les collections de modèles considérées sont celles issues des méthodes de régularisation parcimonieuses, de type Lasso. En particulier, nous nous sommes intéressés à la Pénalité Concave Minimax (MCP), qui garde la sélection du Lasso tout en corrigeant son biais d'estimation. Cette pénalité correspond cependant à un problème non différentiable et non convexe. La généralisation des outils habituels de sous-différentielles grâce aux différentielles de Clarke a permis de déterminer les conditions d'optimalité et de développer un algorithme de chemin de régularisation pour le MCP. Enfin, nous comparons nos propositions avec celles de la littérature au travers d'une étude numérique, dans laquelle nous vérifions la qualité de la sélection. Les résultats montrent notamment que nos critères obtiennent des performances comparables à ceux de la littérature, et que les critères les plus couramment utilisés en pratique (validation croisée) ne sont pas toujours parmi les plus performants.
author Boisbunon, Aurélie
author_facet Boisbunon, Aurélie
author_sort Boisbunon, Aurélie
title Sélection de modèle : une approche décisionnelle
title_short Sélection de modèle : une approche décisionnelle
title_full Sélection de modèle : une approche décisionnelle
title_fullStr Sélection de modèle : une approche décisionnelle
title_full_unstemmed Sélection de modèle : une approche décisionnelle
title_sort sélection de modèle : une approche décisionnelle
publisher Université de Rouen
publishDate 2013
url http://tel.archives-ouvertes.fr/tel-00793898
http://tel.archives-ouvertes.fr/docs/00/79/38/98/PDF/theseBoisbunon.pdf
work_keys_str_mv AT boisbunonaurelie selectiondemodeleuneapprochedecisionnelle
_version_ 1716578133517271040