Aprendizado por reforço utilizando tile coding em cenários multiagente
Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tr...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
2011
|
Subjects: | |
Online Access: | http://hdl.handle.net/10183/28349 |
id |
ndltd-IBICT-oai-www.lume.ufrgs.br-10183-28349 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-www.lume.ufrgs.br-10183-283492019-01-22T01:38:54Z Aprendizado por reforço utilizando tile coding em cenários multiagente Reinforcement learning using tile coding in multiagent scenarios Waskow, Samuel Justo Bazzan, Ana Lucia Cetertich Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one. 2011-03-31T06:00:03Z 2010 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10183/28349 000769941 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
topic |
Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation |
spellingShingle |
Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation Waskow, Samuel Justo Aprendizado por reforço utilizando tile coding em cenários multiagente |
description |
Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. === Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one. |
author2 |
Bazzan, Ana Lucia Cetertich |
author_facet |
Bazzan, Ana Lucia Cetertich Waskow, Samuel Justo |
author |
Waskow, Samuel Justo |
author_sort |
Waskow, Samuel Justo |
title |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_short |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_full |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_fullStr |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_full_unstemmed |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_sort |
aprendizado por reforço utilizando tile coding em cenários multiagente |
publishDate |
2011 |
url |
http://hdl.handle.net/10183/28349 |
work_keys_str_mv |
AT waskowsamueljusto aprendizadoporreforcoutilizandotilecodingemcenariosmultiagente AT waskowsamueljusto reinforcementlearningusingtilecodinginmultiagentscenarios |
_version_ |
1718939645357588480 |