Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.

Le cadre principal de cette thèse est la classification non supervisée, traitée par une approche statistique dans le cadre des modèles de mélange. Plus particulièrement, nous nous intéressons au choix du nombre de classes et au critère de sélection de modèle ICL. Une approche fructueuse de son étude...

Full description

Bibliographic Details
Main Author: Baudry, Jean-Patrick
Language:FRE
Published: Université Paris Sud - Paris XI 2009
Subjects:
BIC
ICL
EM
Online Access:http://tel.archives-ouvertes.fr/tel-00461550
http://tel.archives-ouvertes.fr/docs/00/46/15/50/PDF/Manuscrit_Baudry.pdf
http://tel.archives-ouvertes.fr/docs/00/46/15/50/ANNEX/Slides_Baudry.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00461550
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-004615502013-01-07T18:10:12Z http://tel.archives-ouvertes.fr/tel-00461550 http://tel.archives-ouvertes.fr/docs/00/46/15/50/PDF/Manuscrit_Baudry.pdf http://tel.archives-ouvertes.fr/docs/00/46/15/50/ANNEX/Slides_Baudry.pdf Sélection de modèle pour la classification non supervisée. Choix du nombre de classes. Baudry, Jean-Patrick [MATH] Mathematics Classification non supervisée Sélection de modèle Modèles de mélange Vraisemblance classifiante Critères pénalisés BIC ICL Minimisation de contraste Sélection de modèle data-driven Heuristique de pente EM Point d'effondrement Mélanges de mélanges SICL Le cadre principal de cette thèse est la classification non supervisée, traitée par une approche statistique dans le cadre des modèles de mélange. Plus particulièrement, nous nous intéressons au choix du nombre de classes et au critère de sélection de modèle ICL. Une approche fructueuse de son étude théorique consiste à considérer un contraste adapté à la classification non supervisée : ce faisant, un nouvel estimateur ainsi que de nouveaux critères de sélection de modèle sont proposés et étudiés. Des solutions pratiques pour leur calcul s'accompagnent de retombées positives pour le calcul du maximum de vraisemblance dans les modèles de mélange. La méthode de l'heuristique de pente est appliquée pour la calibration des critères pénalisés considérés. Aussi les bases théoriques en sont-elles rappelées en détails, et deux approches pour son application sont étudiées. Une autre approche de la classification non supervisée est considérée : chaque classe peut être modélisée elle-même par un mélange. Une méthode est proposée pour répondre notamment à la question du choix des composantes à regrouper. Enfin, un critère est proposé pour permettre de lier le choix du nombre de composantes, lorsqu'il est identifié au nombre de classes, à une éventuelle classification externe connue a priori. 2009-12-03 FRE PhD thesis Université Paris Sud - Paris XI
collection NDLTD
language FRE
sources NDLTD
topic [MATH] Mathematics
Classification non supervisée
Sélection de modèle
Modèles de mélange
Vraisemblance classifiante
Critères pénalisés
BIC
ICL
Minimisation de contraste
Sélection de modèle data-driven
Heuristique de pente
EM
Point d'effondrement
Mélanges de mélanges
SICL
spellingShingle [MATH] Mathematics
Classification non supervisée
Sélection de modèle
Modèles de mélange
Vraisemblance classifiante
Critères pénalisés
BIC
ICL
Minimisation de contraste
Sélection de modèle data-driven
Heuristique de pente
EM
Point d'effondrement
Mélanges de mélanges
SICL
Baudry, Jean-Patrick
Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.
description Le cadre principal de cette thèse est la classification non supervisée, traitée par une approche statistique dans le cadre des modèles de mélange. Plus particulièrement, nous nous intéressons au choix du nombre de classes et au critère de sélection de modèle ICL. Une approche fructueuse de son étude théorique consiste à considérer un contraste adapté à la classification non supervisée : ce faisant, un nouvel estimateur ainsi que de nouveaux critères de sélection de modèle sont proposés et étudiés. Des solutions pratiques pour leur calcul s'accompagnent de retombées positives pour le calcul du maximum de vraisemblance dans les modèles de mélange. La méthode de l'heuristique de pente est appliquée pour la calibration des critères pénalisés considérés. Aussi les bases théoriques en sont-elles rappelées en détails, et deux approches pour son application sont étudiées. Une autre approche de la classification non supervisée est considérée : chaque classe peut être modélisée elle-même par un mélange. Une méthode est proposée pour répondre notamment à la question du choix des composantes à regrouper. Enfin, un critère est proposé pour permettre de lier le choix du nombre de composantes, lorsqu'il est identifié au nombre de classes, à une éventuelle classification externe connue a priori.
author Baudry, Jean-Patrick
author_facet Baudry, Jean-Patrick
author_sort Baudry, Jean-Patrick
title Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.
title_short Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.
title_full Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.
title_fullStr Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.
title_full_unstemmed Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.
title_sort sélection de modèle pour la classification non supervisée. choix du nombre de classes.
publisher Université Paris Sud - Paris XI
publishDate 2009
url http://tel.archives-ouvertes.fr/tel-00461550
http://tel.archives-ouvertes.fr/docs/00/46/15/50/PDF/Manuscrit_Baudry.pdf
http://tel.archives-ouvertes.fr/docs/00/46/15/50/ANNEX/Slides_Baudry.pdf
work_keys_str_mv AT baudryjeanpatrick selectiondemodelepourlaclassificationnonsuperviseechoixdunombredeclasses
_version_ 1716451318907797504