APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.

Cette thèse traite des domaines suivant en Apprentissage Automatique: la théorie des Bandits, l'Apprentissage statistique et l'Apprentissage par renforcement. Son fil rouge est l'étude de plusieurs notions d'adaptation, d'un point de vue non asymptotique : à un environnement...

Full description

Bibliographic Details
Main Author: Maillard, Odalric-Ambrym
Language:ENG
Published: Université des Sciences et Technologie de Lille - Lille I 2011
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00845410
http://tel.archives-ouvertes.fr/docs/00/84/54/10/PDF/thesis_Maillard.pdf