Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas

O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na verti...

Full description

Bibliographic Details
Main Author: Vidaurre Navarrete, Nelson Leonardo
Other Authors: Barros, Saulo Rabello Maciel de
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2014
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45132/tde-23032015-110916/
id ndltd-usp.br-oai-teses.usp.br-tde-23032015-110916
record_format oai_dc
collection NDLTD
language pt
format Others
sources NDLTD
topic Computação paralela
Local refinement
Multigrid
Multigrid
Numerical weather simulation
Parallel computing
Refinamento local
Simulação numérica do tempo
spellingShingle Computação paralela
Local refinement
Multigrid
Multigrid
Numerical weather simulation
Parallel computing
Refinamento local
Simulação numérica do tempo
Vidaurre Navarrete, Nelson Leonardo
Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
description O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na vertical e uma malha do tipo C de Arakawa na horizontal. A discretização horizontal é feita através de diferenças finitas de segunda ordem. A equação escalar elíptica tridimensional resultante é desacoplada em um sistema de equações bidimensionais do tipo Helmholtz, o qual é resolvido por meio de um método multigrid. O modelo de paralelização foi desenvolvido para máquinas com memória distribuída, fazendo uso de MPI para passagens de mensagens e baseado em técnicas de decomposição de domínio. O acoplamento apenas local dos operadores de diferenças finitas viabiliza a decomposição em duas direções horizontais. Evitamos a decomposição vertical, tendo em vista o forte acoplamento nesta direção das parametrizações de fenômenos físicos. A estratégia de paralelização foi elaborada visando o uso eficiente de centenas ou alguns milhares de processadores, dependendo da resolução do modelo. Para tal, a malha localmente refinada é separada em três regiões: uma grossa, uma de transição e uma fina, onde cada uma delas é dividida de forma independente entre um número de processadores proporcional ao número de pontos que cada uma armazena, garantindo assim um balanceamento de carga adequado. Não obstante, para resolver o sistema de equações bidimensionais do tipo Helmholtz foi necessário mudar a estratégia de paralelização, dividindo o domínio unicamente nas direções vertical e latitudinal. Ambas partes do modelo com paralelizações diferentes estão conectadas por meio da estratégia de transposição de dados. Testamos nosso modelo utilizando até 1024 processadores e os resultados ainda mostraram uma boa escalabilidade. === The main goal of this work is the parallelization of a weather prediction model employing finite differences on locally refined meshes. The model is based on the primitive equations and uses a three-time-level semi-implicit semi-Lagrangian temporal discretization on a Lorenz-type vertical grid combined with a horizontal Arakawa C-grid. The horizontal discretization is performed by means of second order finite differences. The resulting three-dimensional scalar elliptic equation is decoupled into a set of Helmholtz-type two-dimensional equations, solved by a multigrid method. The parallelization has been written for distributed-memory machines, employing the MPI message passing standard and was based on domain decomposition techniques. The local coupling of the finite difference operators was exploited in a two-dimensional horizontal decomposition. We avoid a vertical decomposition due to the strong coupling of physical parameterization routines. The parallelization strategy has been designed in order to allow the efficient use of hundreds to a few thousand processors, depending on the model resolution. In order to achieve this, the locally refined mesh is split into three regions: a coarse, a transition and a fine one, each decomposed independently. The number of allocated processors for each region is proportional to the number of the grid-points it contains, in order to guarantee a good load-balancing distribution. However, to solve the set of Helmholtz-type bidimensional equations it was necessary to change the parallelization strategy, splitting the domain only in vertical and latitudinal directions. Both parts of the model with different parallelizations are related by means the data transposition strategy. We tested our model using up to 1024 processors and the results still showed a good scalability.
author2 Barros, Saulo Rabello Maciel de
author_facet Barros, Saulo Rabello Maciel de
Vidaurre Navarrete, Nelson Leonardo
author Vidaurre Navarrete, Nelson Leonardo
author_sort Vidaurre Navarrete, Nelson Leonardo
title Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
title_short Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
title_full Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
title_fullStr Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
title_full_unstemmed Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
title_sort paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2014
url http://www.teses.usp.br/teses/disponiveis/45/45132/tde-23032015-110916/
work_keys_str_mv AT vidaurrenavarretenelsonleonardo paralelizacaodeummodeloglobaldeprevisaodotempoemmalhaslocalmenterefinadas
AT vidaurrenavarretenelsonleonardo parallelizationofanumericalweatherpredictionglobalmodelwithlocalrefinementgrids
_version_ 1719071116046106624
spelling ndltd-usp.br-oai-teses.usp.br-tde-23032015-1109162019-05-09T20:58:50Z Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas Parallelization of a numerical weather prediction global model with local refinement grids Vidaurre Navarrete, Nelson Leonardo Computação paralela Local refinement Multigrid Multigrid Numerical weather simulation Parallel computing Refinamento local Simulação numérica do tempo O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na vertical e uma malha do tipo C de Arakawa na horizontal. A discretização horizontal é feita através de diferenças finitas de segunda ordem. A equação escalar elíptica tridimensional resultante é desacoplada em um sistema de equações bidimensionais do tipo Helmholtz, o qual é resolvido por meio de um método multigrid. O modelo de paralelização foi desenvolvido para máquinas com memória distribuída, fazendo uso de MPI para passagens de mensagens e baseado em técnicas de decomposição de domínio. O acoplamento apenas local dos operadores de diferenças finitas viabiliza a decomposição em duas direções horizontais. Evitamos a decomposição vertical, tendo em vista o forte acoplamento nesta direção das parametrizações de fenômenos físicos. A estratégia de paralelização foi elaborada visando o uso eficiente de centenas ou alguns milhares de processadores, dependendo da resolução do modelo. Para tal, a malha localmente refinada é separada em três regiões: uma grossa, uma de transição e uma fina, onde cada uma delas é dividida de forma independente entre um número de processadores proporcional ao número de pontos que cada uma armazena, garantindo assim um balanceamento de carga adequado. Não obstante, para resolver o sistema de equações bidimensionais do tipo Helmholtz foi necessário mudar a estratégia de paralelização, dividindo o domínio unicamente nas direções vertical e latitudinal. Ambas partes do modelo com paralelizações diferentes estão conectadas por meio da estratégia de transposição de dados. Testamos nosso modelo utilizando até 1024 processadores e os resultados ainda mostraram uma boa escalabilidade. The main goal of this work is the parallelization of a weather prediction model employing finite differences on locally refined meshes. The model is based on the primitive equations and uses a three-time-level semi-implicit semi-Lagrangian temporal discretization on a Lorenz-type vertical grid combined with a horizontal Arakawa C-grid. The horizontal discretization is performed by means of second order finite differences. The resulting three-dimensional scalar elliptic equation is decoupled into a set of Helmholtz-type two-dimensional equations, solved by a multigrid method. The parallelization has been written for distributed-memory machines, employing the MPI message passing standard and was based on domain decomposition techniques. The local coupling of the finite difference operators was exploited in a two-dimensional horizontal decomposition. We avoid a vertical decomposition due to the strong coupling of physical parameterization routines. The parallelization strategy has been designed in order to allow the efficient use of hundreds to a few thousand processors, depending on the model resolution. In order to achieve this, the locally refined mesh is split into three regions: a coarse, a transition and a fine one, each decomposed independently. The number of allocated processors for each region is proportional to the number of the grid-points it contains, in order to guarantee a good load-balancing distribution. However, to solve the set of Helmholtz-type bidimensional equations it was necessary to change the parallelization strategy, splitting the domain only in vertical and latitudinal directions. Both parts of the model with different parallelizations are related by means the data transposition strategy. We tested our model using up to 1024 processors and the results still showed a good scalability. Biblioteca Digitais de Teses e Dissertações da USP Barros, Saulo Rabello Maciel de 2014-10-31 Tese de Doutorado application/pdf http://www.teses.usp.br/teses/disponiveis/45/45132/tde-23032015-110916/ pt Liberar o conteúdo para acesso público.