Aprendizado por reforço utilizando tile coding em cenários multiagente

Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tr...

Full description

Bibliographic Details
Main Author:	Waskow, Samuel Justo
Other Authors:	Bazzan, Ana Lucia Cetertich
Format:	Others
Language:	Portuguese
Published:	2011
Subjects:	Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation
Online Access:	http://hdl.handle.net/10183/28349

id	ndltd-IBICT-oai-www.lume.ufrgs.br-10183-28349
record_format	oai_dc
spelling	ndltd-IBICT-oai-www.lume.ufrgs.br-10183-283492019-01-22T01:38:54Z Aprendizado por reforço utilizando tile coding em cenários multiagente Reinforcement learning using tile coding in multiagent scenarios Waskow, Samuel Justo Bazzan, Ana Lucia Cetertich Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one. 2011-03-31T06:00:03Z 2010 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10183/28349 000769941 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS
collection	NDLTD
language	Portuguese
format	Others
sources	NDLTD
topic	Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation
spellingShingle	Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation Waskow, Samuel Justo Aprendizado por reforço utilizando tile coding em cenários multiagente
description	Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. === Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one.
author2	Bazzan, Ana Lucia Cetertich
author_facet	Bazzan, Ana Lucia Cetertich Waskow, Samuel Justo
author	Waskow, Samuel Justo
author_sort	Waskow, Samuel Justo
title	Aprendizado por reforço utilizando tile coding em cenários multiagente
title_short	Aprendizado por reforço utilizando tile coding em cenários multiagente
title_full	Aprendizado por reforço utilizando tile coding em cenários multiagente
title_fullStr	Aprendizado por reforço utilizando tile coding em cenários multiagente
title_full_unstemmed	Aprendizado por reforço utilizando tile coding em cenários multiagente
title_sort	aprendizado por reforço utilizando tile coding em cenários multiagente
publishDate	2011
url	http://hdl.handle.net/10183/28349
work_keys_str_mv	AT waskowsamueljusto aprendizadoporreforcoutilizandotilecodingemcenariosmultiagente AT waskowsamueljusto reinforcementlearningusingtilecodinginmultiagentscenarios
_version_	1718939645357588480

Aprendizado por reforço utilizando tile coding em cenários multiagente

Similar Items