Apprentissage par renforcement utilisant des réseaux de neurones, avec des applications au contrôle moteur
Cette thèse est une étude de méthodes permettant d'estimer des fonctions valeur avec des réseaux de neurones feedforward dans l'apprentissage par renforcement. Elle traite plus particulièrement de problèmes en temps et en espace continus, tels que les tâches de contrôle moteur. Dans ce tra...
Main Author: | |
---|---|
Language: | ENG |
Published: |
2002
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00003985 http://tel.archives-ouvertes.fr/docs/00/04/58/36/PDF/tel-00003985.pdf |