Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o

Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.b...

Full description

Bibliographic Details
Main Author:	Silva, Lucileide Medeiros Dantas da
Other Authors:	02099790469
Language:	Portuguese
Published:	PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O 2017
Subjects:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware
Online Access:	https://repositorio.ufrn.br/jspui/handle/123456789/22395

id	ndltd-IBICT-oai-repositorio.ufrn.br-123456789-22395
record_format	oai_dc
spelling	ndltd-IBICT-oai-repositorio.ufrn.br-123456789-223952018-05-23T23:29:12Z Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o Silva, Lucileide Medeiros Dantas da 02099790469 http://lattes.cnpq.br/3475337353676349 Doria Neto, Adri?o Duarte 10749896434 http://lattes.cnpq.br/1987295209521433 Brito, Alisson Vasconcelos de 02949328440 http://lattes.cnpq.br/6321676636193625 Melo, Jorge Dantas de 09463097449 http://lattes.cnpq.br/7325007451912598 Oliveira, Jos? Alberto Nicolau de 09612890404 http://lattes.cnpq.br/2871134011057075 Fernandes, Marcelo Augusto Costa CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-22T19:38:28Z (GMT) No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Made available in DSpace on 2017-03-22T19:38:28Z (GMT). No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Previous issue date: 2016-11-18 O Q-learning ? uma t?cnica de aprendizagem por refor?o off-policy que tem como principal vantagem a possibilidade de obter uma pol?tica ?tima interagindo com o ambiente sem que o modelo deste ambiente necessite ser conhecido. Este trabalho descreve uma proposta de arquitetura paralela em ponto fixo da t?cnica usando hardware reconfigur?vel do FPGA (Field Programmable Gates Arrays). O objetivo de desenvolver essa t?cnica em hardware ? otimizar o tempo de processamento do sistema. S?o apresentados resultados de converg?ncia do algoritmo, ?rea de ocupa??o e frequ?ncia de amostragem. Tamb?m s?o apresentados detalhes de implementa??o da arquitetura. O projeto foi desenvolvido utilizando a plataforma de desenvolvimento System Generator da Xilinx sendo projetado para o FPGA Virtex 6 xc6vcx240t-1ff1156. Q-learning is a off-policy reinforcement learning technique which has as main advantage the possibility of obtaining an optimal policy interacting with an unknown model environment. This work proposes a parallel fixed-point Q-learning algorithm architecture, implemented in FPGA. Fundamental to this approach is optimize system processing time. Convergence results are presented. The processing time and occupied area were analyzed for diferentes scenarios and various fixed point formats. Architecture implementation details were featured. The entire project was developed using the System Generator platform (Xilinx), with a Virtex-6 xc6vcx240t-1ff1156 as the target FPGA. 2017-03-22T19:38:28Z 2017-03-22T19:38:28Z 2016-11-18 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis SILVA, Lucileide Medeiros Dantas da. Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o. 2016. 72f. Disserta??o (Mestrado em Engenharia El?trica e de Computa??o) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2016. https://repositorio.ufrn.br/jspui/handle/123456789/22395 por info:eu-repo/semantics/openAccess PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O UFRN Brasil reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte instacron:UFRN
collection	NDLTD
language	Portuguese
sources	NDLTD
topic	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware
spellingShingle	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware Silva, Lucileide Medeiros Dantas da Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
description	Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-22T19:38:28Z (GMT) No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Made available in DSpace on 2017-03-22T19:38:28Z (GMT). No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Previous issue date: 2016-11-18 === O Q-learning ? uma t?cnica de aprendizagem por refor?o off-policy que tem como principal vantagem a possibilidade de obter uma pol?tica ?tima interagindo com o ambiente sem que o modelo deste ambiente necessite ser conhecido. Este trabalho descreve uma proposta de arquitetura paralela em ponto fixo da t?cnica usando hardware reconfigur?vel do FPGA (Field Programmable Gates Arrays). O objetivo de desenvolver essa t?cnica em hardware ? otimizar o tempo de processamento do sistema. S?o apresentados resultados de converg?ncia do algoritmo, ?rea de ocupa??o e frequ?ncia de amostragem. Tamb?m s?o apresentados detalhes de implementa??o da arquitetura. O projeto foi desenvolvido utilizando a plataforma de desenvolvimento System Generator da Xilinx sendo projetado para o FPGA Virtex 6 xc6vcx240t-1ff1156. === Q-learning is a off-policy reinforcement learning technique which has as main advantage the possibility of obtaining an optimal policy interacting with an unknown model environment. This work proposes a parallel fixed-point Q-learning algorithm architecture, implemented in FPGA. Fundamental to this approach is optimize system processing time. Convergence results are presented. The processing time and occupied area were analyzed for diferentes scenarios and various fixed point formats. Architecture implementation details were featured. The entire project was developed using the System Generator platform (Xilinx), with a Virtex-6 xc6vcx240t-1ff1156 as the target FPGA.
author2	02099790469
author_facet	02099790469 Silva, Lucileide Medeiros Dantas da
author	Silva, Lucileide Medeiros Dantas da
author_sort	Silva, Lucileide Medeiros Dantas da
title	Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_short	Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_full	Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_fullStr	Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_full_unstemmed	Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_sort	proposta de arquitetura em hardware para fpga da t?cnica qlearning de aprendizagem por refor?o
publisher	PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O
publishDate	2017
url	https://repositorio.ufrn.br/jspui/handle/123456789/22395
work_keys_str_mv	AT silvalucileidemedeirosdantasda propostadearquiteturaemhardwareparafpgadatcnicaqlearningdeaprendizagemporreforo
_version_	1718672710113951744

Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o

Similar Items