Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques

Une voie permettant l'accélération l'apprentissage par renforcement est l'exploration à l'aide des connaissances du domaine. La plus part des algorithmes existants, intitulées transfert de connaissance, sont basés sur une hypothèse implicite : la bonne qualité de la connaissance...

Full description

Bibliographic Details
Main Author: Pamponet Machado, Aydano
Language:FRE
Published: Université Pierre et Marie Curie - Paris VI 2009
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00814207
http://tel.archives-ouvertes.fr/docs/00/81/42/07/PDF/PhD_Machadov8.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00814207
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-008142072013-04-18T03:02:11Z http://tel.archives-ouvertes.fr/tel-00814207 2009PA066209 http://tel.archives-ouvertes.fr/docs/00/81/42/07/PDF/PhD_Machadov8.pdf Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques Pamponet Machado, Aydano [INFO:INFO_MO] Computer Science/Modeling and Simulation transfert de connaissance apprentissage par renforcement systèmes multiagent gridworld simulation situation de jeu Une voie permettant l'accélération l'apprentissage par renforcement est l'exploration à l'aide des connaissances du domaine. La plus part des algorithmes existants, intitulées transfert de connaissance, sont basés sur une hypothèse implicite : la bonne qualité de la connaissance disponible sur la tache courante. Lorsque cette hypothèse n'est pas respectée, les performances se dégradent bien en dessous des celles des méthodes standards. Ce travail de thèse propose des algorithmes de transfert capables de s'adapter à la qualité de la connaissance disponible. Pour le faire, nous introduisons un paramètre nommé le taux de transfert, qui contrôle à quel point l'algorithme se fiera à la connaissance disponible. De plus, nous optimisons ce taux afin de faire meilleur usage de cette politique, en ajoutant de la robustesse à nos algorithmes. Ces algorithmes sont évalués sur un problème jouet (le gridworld), et sur une application d'aide à l'entraineur qui simule une situation de jeu donnée. 2009-06-24 FRE PhD thesis Université Pierre et Marie Curie - Paris VI
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_MO] Computer Science/Modeling and Simulation
transfert de connaissance
apprentissage par renforcement
systèmes multiagent
gridworld
simulation
situation de jeu
spellingShingle [INFO:INFO_MO] Computer Science/Modeling and Simulation
transfert de connaissance
apprentissage par renforcement
systèmes multiagent
gridworld
simulation
situation de jeu
Pamponet Machado, Aydano
Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
description Une voie permettant l'accélération l'apprentissage par renforcement est l'exploration à l'aide des connaissances du domaine. La plus part des algorithmes existants, intitulées transfert de connaissance, sont basés sur une hypothèse implicite : la bonne qualité de la connaissance disponible sur la tache courante. Lorsque cette hypothèse n'est pas respectée, les performances se dégradent bien en dessous des celles des méthodes standards. Ce travail de thèse propose des algorithmes de transfert capables de s'adapter à la qualité de la connaissance disponible. Pour le faire, nous introduisons un paramètre nommé le taux de transfert, qui contrôle à quel point l'algorithme se fiera à la connaissance disponible. De plus, nous optimisons ce taux afin de faire meilleur usage de cette politique, en ajoutant de la robustesse à nos algorithmes. Ces algorithmes sont évalués sur un problème jouet (le gridworld), et sur une application d'aide à l'entraineur qui simule une situation de jeu donnée.
author Pamponet Machado, Aydano
author_facet Pamponet Machado, Aydano
author_sort Pamponet Machado, Aydano
title Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
title_short Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
title_full Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
title_fullStr Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
title_full_unstemmed Le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
title_sort le transfert adaptatif en apprentissage par renforcement : application à la simulation de schéma de jeux tactiques
publisher Université Pierre et Marie Curie - Paris VI
publishDate 2009
url http://tel.archives-ouvertes.fr/tel-00814207
http://tel.archives-ouvertes.fr/docs/00/81/42/07/PDF/PhD_Machadov8.pdf
work_keys_str_mv AT pamponetmachadoaydano letransfertadaptatifenapprentissageparrenforcementapplicationalasimulationdeschemadejeuxtactiques
_version_ 1716580636428337152