SOLVING LARGE SYSTEMS OF LINEAR EQUATIONS ON MULTI-GPU CLUSTERS USING THE CONJUGATE GRADIENT METHOD IN OPENCLTM
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO === COORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIOR === Sistemas de equações lineares esparsos e de grande porte aparecem como resultado da modelagem de vários problemas nas engenharias. Dada sua importância, muitos trabalhos estudam mé...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
2013
|
Online Access: | http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=22099@1 http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=22099@2 |
Summary: | PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO === COORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIOR === Sistemas de equações lineares esparsos e de grande porte aparecem
como resultado da modelagem de vários problemas nas engenharias. Dada
sua importância, muitos trabalhos estudam métodos para a resolução
desses sistemas. Esta dissertação explora o potencial computacional de
múltiplas GPUs, utilizando a tecnologia OpenCL, com a finalidade de
resolver sistemas de equações lineares de grande porte. Na metodologia
proposta, o método do gradiente conjugado é subdivido em kernels que
são resolvidos por múltiplas GPUs. Para tal, se fez necessário compreender
como a arquitetura das GPUs se relaciona com a tecnologia OpenCL a fim
de obter um melhor desempenho. === The process of modeling problems in the engineering fields tends to
produce substantiously large systems of sparse linear equations. Extensive
research has been done to devise methods to solve these systems. This
thesis explores the computational potential of multiple GPUs, through
the use of the OpenCL tecnology, aiming to tackle the solution of large
systems of sparse linear equations. In the proposed methodology, the
conjugate gradient method is subdivided into kernels, which are delegated
to multiple GPUs. In order to achieve an efficient method, it was necessary
to understand how the GPUs’ architecture communicates with OpenCL. |
---|