APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.
Cette thèse traite des domaines suivant en Apprentissage Automatique: la théorie des Bandits, l'Apprentissage statistique et l'Apprentissage par renforcement. Son fil rouge est l'étude de plusieurs notions d'adaptation, d'un point de vue non asymptotique : à un environnement...
Main Author: | |
---|---|
Language: | ENG |
Published: |
Université des Sciences et Technologie de Lille - Lille I
2011
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00845410 http://tel.archives-ouvertes.fr/docs/00/84/54/10/PDF/thesis_Maillard.pdf |