Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas
O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na verti...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | pt |
Published: |
Biblioteca Digitais de Teses e Dissertações da USP
2014
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/45/45132/tde-23032015-110916/ |
id |
ndltd-usp.br-oai-teses.usp.br-tde-23032015-110916 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
pt |
format |
Others
|
sources |
NDLTD |
topic |
Computação paralela Local refinement Multigrid Multigrid Numerical weather simulation Parallel computing Refinamento local Simulação numérica do tempo |
spellingShingle |
Computação paralela Local refinement Multigrid Multigrid Numerical weather simulation Parallel computing Refinamento local Simulação numérica do tempo Vidaurre Navarrete, Nelson Leonardo Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
description |
O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na vertical e uma malha do tipo C de Arakawa na horizontal. A discretização horizontal é feita através de diferenças finitas de segunda ordem. A equação escalar elíptica tridimensional resultante é desacoplada em um sistema de equações bidimensionais do tipo Helmholtz, o qual é resolvido por meio de um método multigrid. O modelo de paralelização foi desenvolvido para máquinas com memória distribuída, fazendo uso de MPI para passagens de mensagens e baseado em técnicas de decomposição de domínio. O acoplamento apenas local dos operadores de diferenças finitas viabiliza a decomposição em duas direções horizontais. Evitamos a decomposição vertical, tendo em vista o forte acoplamento nesta direção das parametrizações de fenômenos físicos. A estratégia de paralelização foi elaborada visando o uso eficiente de centenas ou alguns milhares de processadores, dependendo da resolução do modelo. Para tal, a malha localmente refinada é separada em três regiões: uma grossa, uma de transição e uma fina, onde cada uma delas é dividida de forma independente entre um número de processadores proporcional ao número de pontos que cada uma armazena, garantindo assim um balanceamento de carga adequado. Não obstante, para resolver o sistema de equações bidimensionais do tipo Helmholtz foi necessário mudar a estratégia de paralelização, dividindo o domínio unicamente nas direções vertical e latitudinal. Ambas partes do modelo com paralelizações diferentes estão conectadas por meio da estratégia de transposição de dados. Testamos nosso modelo utilizando até 1024 processadores e os resultados ainda mostraram uma boa escalabilidade. === The main goal of this work is the parallelization of a weather prediction model employing finite differences on locally refined meshes. The model is based on the primitive equations and uses a three-time-level semi-implicit semi-Lagrangian temporal discretization on a Lorenz-type vertical grid combined with a horizontal Arakawa C-grid. The horizontal discretization is performed by means of second order finite differences. The resulting three-dimensional scalar elliptic equation is decoupled into a set of Helmholtz-type two-dimensional equations, solved by a multigrid method. The parallelization has been written for distributed-memory machines, employing the MPI message passing standard and was based on domain decomposition techniques. The local coupling of the finite difference operators was exploited in a two-dimensional horizontal decomposition. We avoid a vertical decomposition due to the strong coupling of physical parameterization routines. The parallelization strategy has been designed in order to allow the efficient use of hundreds to a few thousand processors, depending on the model resolution. In order to achieve this, the locally refined mesh is split into three regions: a coarse, a transition and a fine one, each decomposed independently. The number of allocated processors for each region is proportional to the number of the grid-points it contains, in order to guarantee a good load-balancing distribution. However, to solve the set of Helmholtz-type bidimensional equations it was necessary to change the parallelization strategy, splitting the domain only in vertical and latitudinal directions. Both parts of the model with different parallelizations are related by means the data transposition strategy. We tested our model using up to 1024 processors and the results still showed a good scalability. |
author2 |
Barros, Saulo Rabello Maciel de |
author_facet |
Barros, Saulo Rabello Maciel de Vidaurre Navarrete, Nelson Leonardo |
author |
Vidaurre Navarrete, Nelson Leonardo |
author_sort |
Vidaurre Navarrete, Nelson Leonardo |
title |
Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
title_short |
Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
title_full |
Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
title_fullStr |
Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
title_full_unstemmed |
Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
title_sort |
paralelização de um modelo global de previsão do tempo em malhas localmente refinadas |
publisher |
Biblioteca Digitais de Teses e Dissertações da USP |
publishDate |
2014 |
url |
http://www.teses.usp.br/teses/disponiveis/45/45132/tde-23032015-110916/ |
work_keys_str_mv |
AT vidaurrenavarretenelsonleonardo paralelizacaodeummodeloglobaldeprevisaodotempoemmalhaslocalmenterefinadas AT vidaurrenavarretenelsonleonardo parallelizationofanumericalweatherpredictionglobalmodelwithlocalrefinementgrids |
_version_ |
1719071116046106624 |
spelling |
ndltd-usp.br-oai-teses.usp.br-tde-23032015-1109162019-05-09T20:58:50Z Paralelização de um modelo global de previsão do tempo em malhas localmente refinadas Parallelization of a numerical weather prediction global model with local refinement grids Vidaurre Navarrete, Nelson Leonardo Computação paralela Local refinement Multigrid Multigrid Numerical weather simulation Parallel computing Refinamento local Simulação numérica do tempo O objetivo principal deste trabalho é a paralelização de um modelo global de previsão do tempo em diferenças finitas com refinamento local. Este é baseado nas equações primitivas, e faz uso de uma discretização semi-Lagrangiana e semi-implícita em três níveis no tempo em uma malha de Lorenz na vertical e uma malha do tipo C de Arakawa na horizontal. A discretização horizontal é feita através de diferenças finitas de segunda ordem. A equação escalar elíptica tridimensional resultante é desacoplada em um sistema de equações bidimensionais do tipo Helmholtz, o qual é resolvido por meio de um método multigrid. O modelo de paralelização foi desenvolvido para máquinas com memória distribuída, fazendo uso de MPI para passagens de mensagens e baseado em técnicas de decomposição de domínio. O acoplamento apenas local dos operadores de diferenças finitas viabiliza a decomposição em duas direções horizontais. Evitamos a decomposição vertical, tendo em vista o forte acoplamento nesta direção das parametrizações de fenômenos físicos. A estratégia de paralelização foi elaborada visando o uso eficiente de centenas ou alguns milhares de processadores, dependendo da resolução do modelo. Para tal, a malha localmente refinada é separada em três regiões: uma grossa, uma de transição e uma fina, onde cada uma delas é dividida de forma independente entre um número de processadores proporcional ao número de pontos que cada uma armazena, garantindo assim um balanceamento de carga adequado. Não obstante, para resolver o sistema de equações bidimensionais do tipo Helmholtz foi necessário mudar a estratégia de paralelização, dividindo o domínio unicamente nas direções vertical e latitudinal. Ambas partes do modelo com paralelizações diferentes estão conectadas por meio da estratégia de transposição de dados. Testamos nosso modelo utilizando até 1024 processadores e os resultados ainda mostraram uma boa escalabilidade. The main goal of this work is the parallelization of a weather prediction model employing finite differences on locally refined meshes. The model is based on the primitive equations and uses a three-time-level semi-implicit semi-Lagrangian temporal discretization on a Lorenz-type vertical grid combined with a horizontal Arakawa C-grid. The horizontal discretization is performed by means of second order finite differences. The resulting three-dimensional scalar elliptic equation is decoupled into a set of Helmholtz-type two-dimensional equations, solved by a multigrid method. The parallelization has been written for distributed-memory machines, employing the MPI message passing standard and was based on domain decomposition techniques. The local coupling of the finite difference operators was exploited in a two-dimensional horizontal decomposition. We avoid a vertical decomposition due to the strong coupling of physical parameterization routines. The parallelization strategy has been designed in order to allow the efficient use of hundreds to a few thousand processors, depending on the model resolution. In order to achieve this, the locally refined mesh is split into three regions: a coarse, a transition and a fine one, each decomposed independently. The number of allocated processors for each region is proportional to the number of the grid-points it contains, in order to guarantee a good load-balancing distribution. However, to solve the set of Helmholtz-type bidimensional equations it was necessary to change the parallelization strategy, splitting the domain only in vertical and latitudinal directions. Both parts of the model with different parallelizations are related by means the data transposition strategy. We tested our model using up to 1024 processors and the results still showed a good scalability. Biblioteca Digitais de Teses e Dissertações da USP Barros, Saulo Rabello Maciel de 2014-10-31 Tese de Doutorado application/pdf http://www.teses.usp.br/teses/disponiveis/45/45132/tde-23032015-110916/ pt Liberar o conteúdo para acesso público. |