Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito

Um melhor uso da infraestrutura da rede de transporte é um ponto fundamental para atenuar os efeitos dos congestionamentos no trânsito. Este trabalho utiliza aprendizado por reforço multiagente (MARL) para melhorar o uso da infraestrutura e, consequentemente, mitigar tais congestionamentos. A partir...

Full description

Bibliographic Details
Main Author:	Lemos, Liza Lunardi
Other Authors:	Bazzan, Ana Lucia Cetertich
Format:	Others
Language:	Portuguese
Published:	2018
Subjects:	Informatica : Transportes Multiagent reinforcement learning Traffic signal control Route choice Multiagent system
Online Access:	http://hdl.handle.net/10183/182021

id	ndltd-IBICT-oai-lume56.ufrgs.br-10183-182021
record_format	oai_dc
spelling	ndltd-IBICT-oai-lume56.ufrgs.br-10183-1820212018-09-30T04:29:49Z Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito Co-learning between drivers and traffic lights in microscopic traffic simulation Lemos, Liza Lunardi Bazzan, Ana Lucia Cetertich Informatica : Transportes Multiagent reinforcement learning Traffic signal control Route choice Multiagent system Um melhor uso da infraestrutura da rede de transporte é um ponto fundamental para atenuar os efeitos dos congestionamentos no trânsito. Este trabalho utiliza aprendizado por reforço multiagente (MARL) para melhorar o uso da infraestrutura e, consequentemente, mitigar tais congestionamentos. A partir disso, diversos desafios surgem. Primeiro, a maioria da literatura assume que os motoristas aprendem (semáforos não possuem nenhum tipo de aprendizado) ou os semáforos aprendem (motoristas não alteram seus comportamentos). Em segundo lugar, independentemente do tipo de classe de agentes e do tipo de aprendizado, as ações são altamente acopladas, tornando a tarefa de aprendizado mais difícil. Terceiro, quando duas classes de agentes co-aprendem, as tarefas de aprendizado de cada agente são de natureza diferente (do ponto de vista do aprendizado por reforço multiagente). Finalmente, é utilizada uma modelagem microscópica, que modela os agentes com um alto nível de detalhes, o que não é trivial, pois cada agente tem seu próprio ritmo de aprendizado. Portanto, este trabalho não propõe somente a abordagem de co-aprendizado em agentes que atuam em ambiente compartilhado, mas também argumenta que essa tarefa precisa ser formulada de forma assíncrona. Além disso, os agentes motoristas podem atualizar os valores das ações disponíveis ao receber informações de outros motoristas. Os resultados mostram que a abordagem proposta, baseada no coaprendizado, supera outras políticas em termos de tempo médio de viagem. Além disso, quando o co-aprendizado é utilizado, as filas de veículos parados nos semáforos são menores. A better use of transport network infrastructure is a key point in mitigating the effects of traffic congestion. This work uses multiagent reinforcement learning (MARL) to improve the use of infrastructure and, consequently, to reduce such congestion. From this, several challenges arise. First, most literature assumes that drivers learn (traffic lights do not have any type of learning) or the traffic lights learn (drivers do not change their behaviors). Second, regardless of the type of agent class and the type of learning, the actions are highly coupled, making the learning task more difficult. Third, when two classes of agents co-learn, the learning tasks of each agent are of a different nature (from the point of view of multiagent reinforcement learning). Finally, a microscopic modeling is used, which models the agents with a high level of detail, which is not trivial, since each agent has its own learning pace. Therefore, this work does not only propose the co-learnig approach in agents that act in a shared environment, but also argues that this taks needs to be formulated asynchronously. In addtion, driver agents can update the value of the available actions by receiving information from other drivers. The results show that the proposed approach, based on co-learning, outperforms other policies regarding average travel time. Also, when co-learning is use, queues of stopped vehicles at traffic lights are lower. 2018-09-15T02:57:16Z 2018 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10183/182021 001076495 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS
collection	NDLTD
language	Portuguese
format	Others
sources	NDLTD
topic	Informatica : Transportes Multiagent reinforcement learning Traffic signal control Route choice Multiagent system
spellingShingle	Informatica : Transportes Multiagent reinforcement learning Traffic signal control Route choice Multiagent system Lemos, Liza Lunardi Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
description	Um melhor uso da infraestrutura da rede de transporte é um ponto fundamental para atenuar os efeitos dos congestionamentos no trânsito. Este trabalho utiliza aprendizado por reforço multiagente (MARL) para melhorar o uso da infraestrutura e, consequentemente, mitigar tais congestionamentos. A partir disso, diversos desafios surgem. Primeiro, a maioria da literatura assume que os motoristas aprendem (semáforos não possuem nenhum tipo de aprendizado) ou os semáforos aprendem (motoristas não alteram seus comportamentos). Em segundo lugar, independentemente do tipo de classe de agentes e do tipo de aprendizado, as ações são altamente acopladas, tornando a tarefa de aprendizado mais difícil. Terceiro, quando duas classes de agentes co-aprendem, as tarefas de aprendizado de cada agente são de natureza diferente (do ponto de vista do aprendizado por reforço multiagente). Finalmente, é utilizada uma modelagem microscópica, que modela os agentes com um alto nível de detalhes, o que não é trivial, pois cada agente tem seu próprio ritmo de aprendizado. Portanto, este trabalho não propõe somente a abordagem de co-aprendizado em agentes que atuam em ambiente compartilhado, mas também argumenta que essa tarefa precisa ser formulada de forma assíncrona. Além disso, os agentes motoristas podem atualizar os valores das ações disponíveis ao receber informações de outros motoristas. Os resultados mostram que a abordagem proposta, baseada no coaprendizado, supera outras políticas em termos de tempo médio de viagem. Além disso, quando o co-aprendizado é utilizado, as filas de veículos parados nos semáforos são menores. === A better use of transport network infrastructure is a key point in mitigating the effects of traffic congestion. This work uses multiagent reinforcement learning (MARL) to improve the use of infrastructure and, consequently, to reduce such congestion. From this, several challenges arise. First, most literature assumes that drivers learn (traffic lights do not have any type of learning) or the traffic lights learn (drivers do not change their behaviors). Second, regardless of the type of agent class and the type of learning, the actions are highly coupled, making the learning task more difficult. Third, when two classes of agents co-learn, the learning tasks of each agent are of a different nature (from the point of view of multiagent reinforcement learning). Finally, a microscopic modeling is used, which models the agents with a high level of detail, which is not trivial, since each agent has its own learning pace. Therefore, this work does not only propose the co-learnig approach in agents that act in a shared environment, but also argues that this taks needs to be formulated asynchronously. In addtion, driver agents can update the value of the available actions by receiving information from other drivers. The results show that the proposed approach, based on co-learning, outperforms other policies regarding average travel time. Also, when co-learning is use, queues of stopped vehicles at traffic lights are lower.
author2	Bazzan, Ana Lucia Cetertich
author_facet	Bazzan, Ana Lucia Cetertich Lemos, Liza Lunardi
author	Lemos, Liza Lunardi
author_sort	Lemos, Liza Lunardi
title	Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
title_short	Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
title_full	Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
title_fullStr	Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
title_full_unstemmed	Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
title_sort	co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito
publishDate	2018
url	http://hdl.handle.net/10183/182021
work_keys_str_mv	AT lemoslizalunardi coaprendizadoentremotoristasecontroladoressemaforicosemsimulacaomicroscopicadetransito AT lemoslizalunardi colearningbetweendriversandtrafficlightsinmicroscopictrafficsimulation
_version_	1718756830464704512

Co-aprendizado entre motoristas e controladores semafóricos em simulação microscópica de trânsito

Similar Items