APPRENTISSAGE SÉQUENTIEL : Bandits, Statistique et Renforcement.
Cette thèse traite des domaines suivant en Apprentissage Automatique: la théorie des Bandits, l'Apprentissage statistique et l'Apprentissage par renforcement. Son fil rouge est l'étude de plusieurs notions d'adaptation, d'un point de vue non asymptotique : à un environnement...
Main Author: | Maillard, Odalric-Ambrym |
---|---|
Language: | ENG |
Published: |
Université des Sciences et Technologie de Lille - Lille I
2011
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00845410 http://tel.archives-ouvertes.fr/docs/00/84/54/10/PDF/thesis_Maillard.pdf |
Similar Items
-
Apprentissage séquentiel : bandits, statistique et renforcement
by: Maillard, Odalric-Ambrym
Published: (2011) -
Planification Optimiste pour Systèmes Déterministes
by: Hren, Jean-Francois
Published: (2012) -
Apprentissage statistique relationnel : apprentissage de structures de réseaux de Markov logiques
by: Dinh, Quang-Thang
Published: (2011) -
Modèles d'Ensembles pour l'Apprentissage Multi-Tache, avec des taches Hétérogènes et sans Restrictions
by: Faddoul, Jean Baptiste
Published: (2012) -
Selfish Bandit-Based Cognitive Anti-Jamming Strategy for Aeronautic Swarm Network in Presence of Multiple Jammer
by: Haitao Li, et al.
Published: (2019-01-01)