Aprendizado por reforço utilizando tile coding em cenários multiagente

Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tr...

Full description

Bibliographic Details
Main Author: Waskow, Samuel Justo
Other Authors: Bazzan, Ana Lucia Cetertich
Format: Others
Language:Portuguese
Published: 2011
Subjects:
Online Access:http://hdl.handle.net/10183/28349
id ndltd-IBICT-oai-www.lume.ufrgs.br-10183-28349
record_format oai_dc
spelling ndltd-IBICT-oai-www.lume.ufrgs.br-10183-283492019-01-22T01:38:54Z Aprendizado por reforço utilizando tile coding em cenários multiagente Reinforcement learning using tile coding in multiagent scenarios Waskow, Samuel Justo Bazzan, Ana Lucia Cetertich Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one. 2011-03-31T06:00:03Z 2010 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10183/28349 000769941 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Inteligência artificial
Sistemas multiagentes
Agentes inteligentes
Artificial intelligence
Multiagent systems
Reinforcement learning
Function approximation
spellingShingle Inteligência artificial
Sistemas multiagentes
Agentes inteligentes
Artificial intelligence
Multiagent systems
Reinforcement learning
Function approximation
Waskow, Samuel Justo
Aprendizado por reforço utilizando tile coding em cenários multiagente
description Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. === Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one.
author2 Bazzan, Ana Lucia Cetertich
author_facet Bazzan, Ana Lucia Cetertich
Waskow, Samuel Justo
author Waskow, Samuel Justo
author_sort Waskow, Samuel Justo
title Aprendizado por reforço utilizando tile coding em cenários multiagente
title_short Aprendizado por reforço utilizando tile coding em cenários multiagente
title_full Aprendizado por reforço utilizando tile coding em cenários multiagente
title_fullStr Aprendizado por reforço utilizando tile coding em cenários multiagente
title_full_unstemmed Aprendizado por reforço utilizando tile coding em cenários multiagente
title_sort aprendizado por reforço utilizando tile coding em cenários multiagente
publishDate 2011
url http://hdl.handle.net/10183/28349
work_keys_str_mv AT waskowsamueljusto aprendizadoporreforcoutilizandotilecodingemcenariosmultiagente
AT waskowsamueljusto reinforcementlearningusingtilecodinginmultiagentscenarios
_version_ 1718939645357588480