Aprendizado em sistemas multiagente através de coordenação oportunista.

O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de apendizado por reforço multiagente em problemas complexos. Este trabalho propõe o opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar co...

Full description

Bibliographic Details
Main Author:	Oliveira, Denise de
Other Authors:	Bazzan, Ana Lucia Cetertich
Format:	Others
Language:	Portuguese
Published:	2010
Subjects:	Inteligência artificial Sistemas multiagentes Cadeias : Markov Multiagent systems Reinforcement learning Coordination
Online Access:	http://hdl.handle.net/10183/26857

id	ndltd-IBICT-oai-lume.ufrgs.br-10183-26857
record_format	oai_dc
spelling	ndltd-IBICT-oai-lume.ufrgs.br-10183-268572018-10-21T16:56:25Z Aprendizado em sistemas multiagente através de coordenação oportunista. Towards joint learning in multiagent systems through oppotunistic coordination Oliveira, Denise de Bazzan, Ana Lucia Cetertich Inteligência artificial Sistemas multiagentes Cadeias : Markov Multiagent systems Reinforcement learning Coordination O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de apendizado por reforço multiagente em problemas complexos. Este trabalho propõe o opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar com grandes cenários. Visto que uma solução centralizada não é praticável em grandes espaços de estado-ação, um modode reduzir a complexidade do problema é decompô-lo em subproblemas utilizando cooperação entre agentes independentes em algumas partes do ambiente. No método proposto, agentes independentes utilizam comunicação e um mecanismo de cooperação que permite que haja expansão de suas percepções sobre o ambiente e para que executem ações cooperativas apenas quando é melhor que agir de modo individual. O OPPORTUNE foi testado e comparado em dois cenários: jogo de perseguição e controle de tráfego urbano. The size of the representation of joint states and actions is a key factor that limits the use oh standard multiagent reinforcement learning algorithms in complex problems. This work proposes opportunistic Coordination Learning (OPPORTUNE), a multiagent reinforcement learning method to cope with large scenarios. Because a centralized solution becomes impratical in large state-action spaces, one way of reducing the complexity is to decompose the problem into sub-problems using cooperation between independent agents in some parts of the environment. In the proposed method, independent agents use communication and cooperation mechanism allowing them to extended their perception of the environment and to perform cooperative actions only when this is better than acting individually. OPPORTUNE was tested and compared in twm scenarios: pursuit game and urban traffic control. 2010-11-25T04:21:34Z 2009 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10183/26857 000759645 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS
collection	NDLTD
language	Portuguese
format	Others
sources	NDLTD
topic	Inteligência artificial Sistemas multiagentes Cadeias : Markov Multiagent systems Reinforcement learning Coordination
spellingShingle	Inteligência artificial Sistemas multiagentes Cadeias : Markov Multiagent systems Reinforcement learning Coordination Oliveira, Denise de Aprendizado em sistemas multiagente através de coordenação oportunista.
description	O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de apendizado por reforço multiagente em problemas complexos. Este trabalho propõe o opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar com grandes cenários. Visto que uma solução centralizada não é praticável em grandes espaços de estado-ação, um modode reduzir a complexidade do problema é decompô-lo em subproblemas utilizando cooperação entre agentes independentes em algumas partes do ambiente. No método proposto, agentes independentes utilizam comunicação e um mecanismo de cooperação que permite que haja expansão de suas percepções sobre o ambiente e para que executem ações cooperativas apenas quando é melhor que agir de modo individual. O OPPORTUNE foi testado e comparado em dois cenários: jogo de perseguição e controle de tráfego urbano. === The size of the representation of joint states and actions is a key factor that limits the use oh standard multiagent reinforcement learning algorithms in complex problems. This work proposes opportunistic Coordination Learning (OPPORTUNE), a multiagent reinforcement learning method to cope with large scenarios. Because a centralized solution becomes impratical in large state-action spaces, one way of reducing the complexity is to decompose the problem into sub-problems using cooperation between independent agents in some parts of the environment. In the proposed method, independent agents use communication and cooperation mechanism allowing them to extended their perception of the environment and to perform cooperative actions only when this is better than acting individually. OPPORTUNE was tested and compared in twm scenarios: pursuit game and urban traffic control.
author2	Bazzan, Ana Lucia Cetertich
author_facet	Bazzan, Ana Lucia Cetertich Oliveira, Denise de
author	Oliveira, Denise de
author_sort	Oliveira, Denise de
title	Aprendizado em sistemas multiagente através de coordenação oportunista.
title_short	Aprendizado em sistemas multiagente através de coordenação oportunista.
title_full	Aprendizado em sistemas multiagente através de coordenação oportunista.
title_fullStr	Aprendizado em sistemas multiagente através de coordenação oportunista.
title_full_unstemmed	Aprendizado em sistemas multiagente através de coordenação oportunista.
title_sort	aprendizado em sistemas multiagente através de coordenação oportunista.
publishDate	2010
url	http://hdl.handle.net/10183/26857
work_keys_str_mv	AT oliveiradenisede aprendizadoemsistemasmultiagenteatravesdecoordenacaooportunista AT oliveiradenisede towardsjointlearninginmultiagentsystemsthroughoppotunisticcoordination
_version_	1718779581650960384

Aprendizado em sistemas multiagente através de coordenação oportunista.

Similar Items