Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.b...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O
2017
|
Subjects: | |
Online Access: | https://repositorio.ufrn.br/jspui/handle/123456789/22395 |
id |
ndltd-IBICT-oai-repositorio.ufrn.br-123456789-22395 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-repositorio.ufrn.br-123456789-223952018-05-23T23:29:12Z Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o Silva, Lucileide Medeiros Dantas da 02099790469 http://lattes.cnpq.br/3475337353676349 Doria Neto, Adri?o Duarte 10749896434 http://lattes.cnpq.br/1987295209521433 Brito, Alisson Vasconcelos de 02949328440 http://lattes.cnpq.br/6321676636193625 Melo, Jorge Dantas de 09463097449 http://lattes.cnpq.br/7325007451912598 Oliveira, Jos? Alberto Nicolau de 09612890404 http://lattes.cnpq.br/2871134011057075 Fernandes, Marcelo Augusto Costa CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-22T19:38:28Z (GMT) No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Made available in DSpace on 2017-03-22T19:38:28Z (GMT). No. of bitstreams: 1 LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) Previous issue date: 2016-11-18 O Q-learning ? uma t?cnica de aprendizagem por refor?o off-policy que tem como principal vantagem a possibilidade de obter uma pol?tica ?tima interagindo com o ambiente sem que o modelo deste ambiente necessite ser conhecido. Este trabalho descreve uma proposta de arquitetura paralela em ponto fixo da t?cnica usando hardware reconfigur?vel do FPGA (Field Programmable Gates Arrays). O objetivo de desenvolver essa t?cnica em hardware ? otimizar o tempo de processamento do sistema. S?o apresentados resultados de converg?ncia do algoritmo, ?rea de ocupa??o e frequ?ncia de amostragem. Tamb?m s?o apresentados detalhes de implementa??o da arquitetura. O projeto foi desenvolvido utilizando a plataforma de desenvolvimento System Generator da Xilinx sendo projetado para o FPGA Virtex 6 xc6vcx240t-1ff1156. Q-learning is a off-policy reinforcement learning technique which has as main advantage the possibility of obtaining an optimal policy interacting with an unknown model environment. This work proposes a parallel fixed-point Q-learning algorithm architecture, implemented in FPGA. Fundamental to this approach is optimize system processing time. Convergence results are presented. The processing time and occupied area were analyzed for diferentes scenarios and various fixed point formats. Architecture implementation details were featured. The entire project was developed using the System Generator platform (Xilinx), with a Virtex-6 xc6vcx240t-1ff1156 as the target FPGA. 2017-03-22T19:38:28Z 2017-03-22T19:38:28Z 2016-11-18 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis SILVA, Lucileide Medeiros Dantas da. Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o. 2016. 72f. Disserta??o (Mestrado em Engenharia El?trica e de Computa??o) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2016. https://repositorio.ufrn.br/jspui/handle/123456789/22395 por info:eu-repo/semantics/openAccess PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O UFRN Brasil reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte instacron:UFRN |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware |
spellingShingle |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTA??O FPGA Q-learning Aprendizagem por refor?o Hardware Silva, Lucileide Medeiros Dantas da Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o |
description |
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-03-20T19:50:20Z
No. of bitstreams: 1
LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-22T19:38:28Z (GMT) No. of bitstreams: 1
LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5) === Made available in DSpace on 2017-03-22T19:38:28Z (GMT). No. of bitstreams: 1
LucileideMedeirosDantasDaSilva_DISSERT.pdf: 995627 bytes, checksum: c5a0cf7ba1df8a88275e1f7c185e1eac (MD5)
Previous issue date: 2016-11-18 === O Q-learning ? uma t?cnica de aprendizagem por refor?o off-policy que tem como
principal vantagem a possibilidade de obter uma pol?tica ?tima interagindo com o ambiente
sem que o modelo deste ambiente necessite ser conhecido. Este trabalho descreve
uma proposta de arquitetura paralela em ponto fixo da t?cnica usando hardware reconfigur?vel
do FPGA (Field Programmable Gates Arrays). O objetivo de desenvolver essa
t?cnica em hardware ? otimizar o tempo de processamento do sistema. S?o apresentados
resultados de converg?ncia do algoritmo, ?rea de ocupa??o e frequ?ncia de amostragem.
Tamb?m s?o apresentados detalhes de implementa??o da arquitetura. O projeto foi desenvolvido
utilizando a plataforma de desenvolvimento System Generator da Xilinx sendo
projetado para o FPGA Virtex 6 xc6vcx240t-1ff1156. === Q-learning is a off-policy reinforcement learning technique which has as main advantage
the possibility of obtaining an optimal policy interacting with an unknown model
environment. This work proposes a parallel fixed-point Q-learning algorithm architecture,
implemented in FPGA. Fundamental to this approach is optimize system processing time.
Convergence results are presented. The processing time and occupied area were analyzed
for diferentes scenarios and various fixed point formats. Architecture implementation
details were featured. The entire project was developed using the System Generator platform
(Xilinx), with a Virtex-6 xc6vcx240t-1ff1156 as the target FPGA. |
author2 |
02099790469 |
author_facet |
02099790469 Silva, Lucileide Medeiros Dantas da |
author |
Silva, Lucileide Medeiros Dantas da |
author_sort |
Silva, Lucileide Medeiros Dantas da |
title |
Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o |
title_short |
Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o |
title_full |
Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o |
title_fullStr |
Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o |
title_full_unstemmed |
Proposta de arquitetura em Hardware para FPGA da t?cnica Qlearning de aprendizagem por refor?o |
title_sort |
proposta de arquitetura em hardware para fpga da t?cnica qlearning de aprendizagem por refor?o |
publisher |
PROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O |
publishDate |
2017 |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/22395 |
work_keys_str_mv |
AT silvalucileidemedeirosdantasda propostadearquiteturaemhardwareparafpgadatcnicaqlearningdeaprendizagemporreforo |
_version_ |
1718672710113951744 |