Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
Une voie permettant l'accélération l'apprentissage par renforcement est l'exploration à l'aide des connaissances du domaine. La plus part des algorithmes existants, intitulées transfert de connaissance, sont basés sur une hypothèse implicite : la bonne qualité de la connaissance...
Main Author: | |
---|---|
Language: | FRE |
Published: |
Université Pierre et Marie Curie - Paris VI
2009
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00814207 http://tel.archives-ouvertes.fr/docs/00/81/42/07/PDF/PhD_Machadov8.pdf |
id |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00814207 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-008142072013-04-18T03:02:11Z http://tel.archives-ouvertes.fr/tel-00814207 2009PA066209 http://tel.archives-ouvertes.fr/docs/00/81/42/07/PDF/PhD_Machadov8.pdf Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques Pamponet Machado, Aydano [INFO:INFO_MO] Computer Science/Modeling and Simulation transfert de connaissance apprentissage par renforcement systèmes multiagent gridworld simulation situation de jeu Une voie permettant l'accélération l'apprentissage par renforcement est l'exploration à l'aide des connaissances du domaine. La plus part des algorithmes existants, intitulées transfert de connaissance, sont basés sur une hypothèse implicite : la bonne qualité de la connaissance disponible sur la tache courante. Lorsque cette hypothèse n'est pas respectée, les performances se dégradent bien en dessous des celles des méthodes standards. Ce travail de thèse propose des algorithmes de transfert capables de s'adapter à la qualité de la connaissance disponible. Pour le faire, nous introduisons un paramètre nommé le taux de transfert, qui contrôle à quel point l'algorithme se fiera à la connaissance disponible. De plus, nous optimisons ce taux afin de faire meilleur usage de cette politique, en ajoutant de la robustesse à nos algorithmes. Ces algorithmes sont évalués sur un problème jouet (le gridworld), et sur une application d'aide à l'entraineur qui simule une situation de jeu donnée. 2009-06-24 FRE PhD thesis Université Pierre et Marie Curie - Paris VI |
collection |
NDLTD |
language |
FRE |
sources |
NDLTD |
topic |
[INFO:INFO_MO] Computer Science/Modeling and Simulation transfert de connaissance apprentissage par renforcement systèmes multiagent gridworld simulation situation de jeu |
spellingShingle |
[INFO:INFO_MO] Computer Science/Modeling and Simulation transfert de connaissance apprentissage par renforcement systèmes multiagent gridworld simulation situation de jeu Pamponet Machado, Aydano Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
description |
Une voie permettant l'accélération l'apprentissage par renforcement est l'exploration à l'aide des connaissances du domaine. La plus part des algorithmes existants, intitulées transfert de connaissance, sont basés sur une hypothèse implicite : la bonne qualité de la connaissance disponible sur la tache courante. Lorsque cette hypothèse n'est pas respectée, les performances se dégradent bien en dessous des celles des méthodes standards. Ce travail de thèse propose des algorithmes de transfert capables de s'adapter à la qualité de la connaissance disponible. Pour le faire, nous introduisons un paramètre nommé le taux de transfert, qui contrôle à quel point l'algorithme se fiera à la connaissance disponible. De plus, nous optimisons ce taux afin de faire meilleur usage de cette politique, en ajoutant de la robustesse à nos algorithmes. Ces algorithmes sont évalués sur un problème jouet (le gridworld), et sur une application d'aide à l'entraineur qui simule une situation de jeu donnée. |
author |
Pamponet Machado, Aydano |
author_facet |
Pamponet Machado, Aydano |
author_sort |
Pamponet Machado, Aydano |
title |
Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
title_short |
Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
title_full |
Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
title_fullStr |
Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
title_full_unstemmed |
Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
title_sort |
le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques |
publisher |
Université Pierre et Marie Curie - Paris VI |
publishDate |
2009 |
url |
http://tel.archives-ouvertes.fr/tel-00814207 http://tel.archives-ouvertes.fr/docs/00/81/42/07/PDF/PhD_Machadov8.pdf |
work_keys_str_mv |
AT pamponetmachadoaydano letransfertadaptatifenapprentissageparrenforcementapplicationalasimulationdeschemadejeuxtactiques |
_version_ |
1716580636428337152 |