Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o

Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.b...

Full description

Bibliographic Details
Main Author: Silva, Lucileide Medeiros Dantas da
Other Authors: 02099790469
Language:Portuguese
Published: PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O 2017
Subjects:
Online Access:https://repositorio.ufrn.br/jspui/handle/123456789/22395
id ndltd-IBICT-oai-repositorio.ufrn.br-123456789-22395
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufrn.br-123456789-223952018-05-23T23:29:12Z Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o Silva, Lucileide Medeiros Dantas da 02099790469 http://lattes.cnpq.br/3475337353676349 Doria Neto, Adri?o Duarte 10749896434 http://lattes.cnpq.br/1987295209521433 Brito, Alisson Vasconcelos de 02949328440 http://lattes.cnpq.br/6321676636193625 Melo, Jorge Dantas de 09463097449 http://lattes.cnpq.br/7325007451912598 Oliveira, Jos? Alberto Nicolau de 09612890404 http://lattes.cnpq.br/2871134011057075 Fernandes, Marcelo Augusto Costa CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-22T19:38:28Z (GMT) No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Made available in DSpace on 2017-03-22T19:38:28Z (GMT). No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Previous issue date: 2016-11-18 O Q-learning ? uma t?cnica de aprendizagem por refor?o off-policy que tem como principal vantagem a possibilidade de obter uma pol?tica ?tima interagindo com o ambiente sem que o modelo deste ambiente necessite ser conhecido. Este trabalho descreve uma proposta de arquitetura paralela em ponto fixo da t?cnica usando hardware reconfigur?vel do FPGA (Field Programmable Gates Arrays). O objetivo de desenvolver essa t?cnica em hardware ? otimizar o tempo de processamento do sistema. S?o apresentados resultados de converg?ncia do algoritmo, ?rea de ocupa??o e frequ?ncia de amostragem. Tamb?m s?o apresentados detalhes de implementa??o da arquitetura. O projeto foi desenvolvido utilizando a plataforma de desenvolvimento System Generator da Xilinx sendo projetado para o FPGA Virtex 6 xc6vcx240t-1ff1156. Q-learning is a off-policy reinforcement learning technique which has as main advantage the possibility of obtaining an optimal policy interacting with an unknown model environment. This work proposes a parallel fixed-point Q-learning algorithm architecture, implemented in FPGA. Fundamental to this approach is optimize system processing time. Convergence results are presented. The processing time and occupied area were analyzed for diferentes scenarios and various fixed point formats. Architecture implementation details were featured. The entire project was developed using the System Generator platform (Xilinx), with a Virtex-6 xc6vcx240t-1ff1156 as the target FPGA. 2017-03-22T19:38:28Z 2017-03-22T19:38:28Z 2016-11-18 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis SILVA, Lucileide Medeiros Dantas da. Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o. 2016. 72f. Disserta??o (Mestrado em Engenharia El?trica e de Computa??o) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2016. https://repositorio.ufrn.br/jspui/handle/123456789/22395 por info:eu-repo/semantics/openAccess PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O UFRN Brasil reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte instacron:UFRN
collection NDLTD
language Portuguese
sources NDLTD
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O
FPGA
Q-learning
Aprendizagem por refor?o
Hardware
spellingShingle CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O
FPGA
Q-learning
Aprendizagem por refor?o
Hardware
Silva, Lucileide Medeiros Dantas da
Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
description Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-22T19:38:28Z (GMT) No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Made available in DSpace on 2017-03-22T19:38:28Z (GMT). No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Previous issue date: 2016-11-18 === O Q-learning ? uma t?cnica de aprendizagem por refor?o off-policy que tem como principal vantagem a possibilidade de obter uma pol?tica ?tima interagindo com o ambiente sem que o modelo deste ambiente necessite ser conhecido. Este trabalho descreve uma proposta de arquitetura paralela em ponto fixo da t?cnica usando hardware reconfigur?vel do FPGA (Field Programmable Gates Arrays). O objetivo de desenvolver essa t?cnica em hardware ? otimizar o tempo de processamento do sistema. S?o apresentados resultados de converg?ncia do algoritmo, ?rea de ocupa??o e frequ?ncia de amostragem. Tamb?m s?o apresentados detalhes de implementa??o da arquitetura. O projeto foi desenvolvido utilizando a plataforma de desenvolvimento System Generator da Xilinx sendo projetado para o FPGA Virtex 6 xc6vcx240t-1ff1156. === Q-learning is a off-policy reinforcement learning technique which has as main advantage the possibility of obtaining an optimal policy interacting with an unknown model environment. This work proposes a parallel fixed-point Q-learning algorithm architecture, implemented in FPGA. Fundamental to this approach is optimize system processing time. Convergence results are presented. The processing time and occupied area were analyzed for diferentes scenarios and various fixed point formats. Architecture implementation details were featured. The entire project was developed using the System Generator platform (Xilinx), with a Virtex-6 xc6vcx240t-1ff1156 as the target FPGA.
author2 02099790469
author_facet 02099790469
Silva, Lucileide Medeiros Dantas da
author Silva, Lucileide Medeiros Dantas da
author_sort Silva, Lucileide Medeiros Dantas da
title Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_short Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_full Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_fullStr Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_full_unstemmed Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
title_sort proposta de arquitetura em hardware para fpga da t?cnica qlearning de aprendizagem por refor?o
publisher PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O
publishDate 2017
url https://repositorio.ufrn.br/jspui/handle/123456789/22395
work_keys_str_mv AT silvalucileidemedeirosdantasda propostadearquiteturaemhardwareparafpgadatcnicaqlearningdeaprendizagemporreforo
_version_ 1718672710113951744