Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho
Made available in DSpace on 2014-06-12T15:54:52Z (GMT). No. of bitstreams: 2 arquivo2015_1.pdf: 2391415 bytes, checksum: 09ab851c629f8ccc9ea982e2c53f53b3 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 === A recente evolução na arquitetura...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade Federal de Pernambuco
2014
|
Subjects: | |
Online Access: | https://repositorio.ufpe.br/handle/123456789/2140 |
id |
ndltd-IBICT-oai-repositorio.ufpe.br-123456789-2140 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-repositorio.ufpe.br-123456789-21402019-01-21T19:03:24Z Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho Lucy Santos de Souza, Viviane Eusébio de Lima, Manoel FPGA Plataforma RASC Paralelismo Computação reconfigurável de alto desempenho Made available in DSpace on 2014-06-12T15:54:52Z (GMT). No. of bitstreams: 2 arquivo2015_1.pdf: 2391415 bytes, checksum: 09ab851c629f8ccc9ea982e2c53f53b3 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 A recente evolução na arquitetura dos dispositivos lógicos programáveis, como os FPGAs (Field Programmable Gate Array), associada à demanda por desempenho exigida em aplicações de computação científica, despertou a atenção de projetistas de supercomputadores que têm investido na criação de plataformas híbridas, associando processadores de propósito geral a co-processadores baseados em FPGAs, em busca de melhores níveis de aceleração. Uma arquitetura que incorpore um ou mais processadores de propósito geral e FPGAs num link de alta velocidade é chamada computador reconfigurável de alto desempenho. Este tipo de configuração requer, em geral, uma alta largura de banda entre o processador e o FPGA, necessário para que os ganhos com a execução em hardware superem o gargalo na comunicação. O sucesso dessas plataformas depende de características como: recursos presentes no FPGA, disponibilidade de memória na arquitetura, largura de banda e capacidade de escalabilidade das mesmas. Ao mesmo tempo, uma análise adequada do problema e um particionamento hardware/software eficiente, são necessários. Neste caso, processos com características de controle devem ser executados no processador de propósito geral e a computação intensiva deve ser executada em FPGA, onde podem ser exploradas características como paralelismo de execução e reuso de dados. Neste trabalho, são estudadas as principais características de alguns dos computadores reconfiguráveis de alto desempenho existentes. Além disso, como estudo de caso, é apresentada a análise e desenvolvimento de uma das importantes operações da computação científica: a multiplicação de matrizes, objetivando uma das plataformas estudadas, a plataforma RASC (Reconfigurable Application-Specific Computing), desenvolvida pela Silicon Graphics. A arquitetura proposta no estudo de caso visa, a partir da análise do problema e da avaliação dos recursos disponíveis na plataforma alvo, a obtenção de melhores resultados de desempenho quando comparado à execução em plataformas convencionais, baseadas em processadores de propósito geral. Para tanto, características como paralelismo e o reuso de dados são exploradas. A partir do projeto desenvolvido, é apresentado um modelo para avaliação de desempenho do multiplicador que pode ser aplicado às demais plataformas estudadas 2014-06-12T15:54:52Z 2014-06-12T15:54:52Z 2011-01-31 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis Lucy Santos de Souza, Viviane; Eusébio de Lima, Manoel. Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho. 2011. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2011. https://repositorio.ufpe.br/handle/123456789/2140 por info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
FPGA Plataforma RASC Paralelismo Computação reconfigurável de alto desempenho |
spellingShingle |
FPGA Plataforma RASC Paralelismo Computação reconfigurável de alto desempenho Lucy Santos de Souza, Viviane Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
description |
Made available in DSpace on 2014-06-12T15:54:52Z (GMT). No. of bitstreams: 2
arquivo2015_1.pdf: 2391415 bytes, checksum: 09ab851c629f8ccc9ea982e2c53f53b3 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2011 === A recente evolução na arquitetura dos dispositivos lógicos programáveis, como os
FPGAs (Field Programmable Gate Array), associada à demanda por desempenho exigida em
aplicações de computação científica, despertou a atenção de projetistas de supercomputadores
que têm investido na criação de plataformas híbridas, associando processadores de propósito
geral a co-processadores baseados em FPGAs, em busca de melhores níveis de aceleração.
Uma arquitetura que incorpore um ou mais processadores de propósito geral e FPGAs
num link de alta velocidade é chamada computador reconfigurável de alto desempenho. Este
tipo de configuração requer, em geral, uma alta largura de banda entre o processador e o
FPGA, necessário para que os ganhos com a execução em hardware superem o gargalo na
comunicação.
O sucesso dessas plataformas depende de características como: recursos presentes no
FPGA, disponibilidade de memória na arquitetura, largura de banda e capacidade de
escalabilidade das mesmas. Ao mesmo tempo, uma análise adequada do problema e um
particionamento hardware/software eficiente, são necessários. Neste caso, processos com
características de controle devem ser executados no processador de propósito geral e a
computação intensiva deve ser executada em FPGA, onde podem ser exploradas
características como paralelismo de execução e reuso de dados.
Neste trabalho, são estudadas as principais características de alguns dos computadores
reconfiguráveis de alto desempenho existentes. Além disso, como estudo de caso, é
apresentada a análise e desenvolvimento de uma das importantes operações da computação
científica: a multiplicação de matrizes, objetivando uma das plataformas estudadas, a
plataforma RASC (Reconfigurable Application-Specific Computing), desenvolvida pela
Silicon Graphics.
A arquitetura proposta no estudo de caso visa, a partir da análise do problema e da
avaliação dos recursos disponíveis na plataforma alvo, a obtenção de melhores resultados de
desempenho quando comparado à execução em plataformas convencionais, baseadas em
processadores de propósito geral. Para tanto, características como paralelismo e o reuso de
dados são exploradas.
A partir do projeto desenvolvido, é apresentado um modelo para avaliação de
desempenho do multiplicador que pode ser aplicado às demais plataformas estudadas |
author2 |
Eusébio de Lima, Manoel |
author_facet |
Eusébio de Lima, Manoel Lucy Santos de Souza, Viviane |
author |
Lucy Santos de Souza, Viviane |
author_sort |
Lucy Santos de Souza, Viviane |
title |
Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
title_short |
Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
title_full |
Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
title_fullStr |
Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
title_full_unstemmed |
Implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
title_sort |
implementação de uma arquitetura para multiplicação de matrizes densas em sistemas reconfiguráveis de alto desempenho |
publisher |
Universidade Federal de Pernambuco |
publishDate |
2014 |
url |
https://repositorio.ufpe.br/handle/123456789/2140 |
work_keys_str_mv |
AT lucysantosdesouzaviviane implementacaodeumaarquiteturaparamultiplicacaodematrizesdensasemsistemasreconfiguraveisdealtodesempenho |
_version_ |
1718859611825504256 |