APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.

Cette thèse traite des domaines suivant en Apprentissage Automatique: la théorie des Bandits, l'Apprentissage statistique et l'Apprentissage par renforcement. Son fil rouge est l'étude de plusieurs notions d'adaptation, d'un point de vue non asymptotique : à un environnement...

Full description

Bibliographic Details
Main Author:	Maillard, Odalric-Ambrym
Language:	ENG
Published:	Université des Sciences et Technologie de Lille - Lille I 2011
Subjects:	[INFO:INFO_LG] Computer Science/Learning problème du bandit adversarial bornes de performance projections aléatoires algorithme KL-UCB
Online Access:	http://tel.archives-ouvertes.fr/tel-00845410 http://tel.archives-ouvertes.fr/docs/00/84/54/10/PDF/thesis_Maillard.pdf

Internet

http://tel.archives-ouvertes.fr/tel-00845410
http://tel.archives-ouvertes.fr/docs/00/84/54/10/PDF/thesis_Maillard.pdf

APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.

Internet

Similar Items