Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola
Este trabalho relata o procedimento utilizado na obtenção de um banco de dados contínuo de precipitação diária de estações meteorológicas localizadas no Estado do Paraná. O banco de dados é composto por 484 séries históricas com dados entre janeiro de 1975 a dezembro de 2009. Para preencher os d...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade de São Paulo
2011
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/11/11134/tde-28062011-103251/ |
id |
ndltd-IBICT-oai-teses.usp.br-tde-28062011-103251 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Banco de dados
Controle de qualidade Estações meteorológicas Modelagem de dados Pluviometria Precipitação atmosférica Seca Data Modeling Database Drought. Precipitation Quality control Rainfall Weather stations |
spellingShingle |
Banco de dados
Controle de qualidade Estações meteorológicas Modelagem de dados Pluviometria Precipitação atmosférica Seca Data Modeling Database Drought. Precipitation Quality control Rainfall Weather stations Gláucia Tatiana Ferrari Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola |
description |
Este trabalho relata o procedimento utilizado na obtenção de um banco de dados contínuo de precipitação diária de estações meteorológicas localizadas no Estado do Paraná. O banco de dados é composto por 484 séries históricas com dados entre janeiro de 1975 a dezembro de 2009. Para preencher os dados faltantes do banco de dados foram testados três métodos de imputação: o vizinho mais próximo, distância inversa ponderada e regressão linear. A raiz do erro quadrático médio (REQM) foi utilizada para comparar os métodos e o método da distância inversa ponderada proporcionou o melhor resultado. Após a imputação, os dados passaram por um processo de controle de qualidade que teve como objetivo identificar possíveis erros como precipitação idêntica em sete dias consecutivos (não aplicados a dados de precipitação zero) e valores de precipitação que diferem significativamente dos valores em estações meteorológicas vizinhas. Neste processo foram substituídos 1,21% valores de precipitação. Com o banco de dados contínuo, o interesse foi utilizar a teoria de valores extremos para modelar o período seco (número máximo de dias consecutivos com precipitação abaixo de 7mm para o período entre janeiro e fevereiro) crítico para a fase de enchimento de grãos da soja nas cinco principais mesorregiões (Centro Ocidental, Centro Sul, Norte Central, Oeste e Sudoeste) produtoras do Estado do Paraná. Pelo teste de Kolmogorov-Smirnov, ao nível de 5% de significância, a distribuição Gumbel foi a que melhor se ajustou aos dados de cada mesorregião e assim, a probabilidade de ocorrência de valores extremos de seca acima de 5, 25, 35 e 45 dias, o período de retorno para os maiores valores registrados em cada mesorregião e os níveis de retorno para o período de 5, 25, 50 e 75 anos foram calculados.
===
This paper describes the procedure used to obtain a continuous database of daily precipitation from weather stations located in the state of Parana. The database consists of 484 time series with data from January 1975 to December 2009. To complete missing data from the database were tested three imputation methods: the nearest neighbour, inverse distance weighting and linear regression. The root mean square error (RMSE) was used to compare the methods and the inverse distance weighting method yielded better results. After imputing the data went through a process of quality control that aimed to identify possible errors as precipitation identical in seven consecutive days (not applied to precipitation data zero) and precipitation values that dier signicantly from the values in neighboring meteorological stations. In this process were replaced 1.21 % values of precipitation. With a continuous database, the interest was to use the Extreme Value Theory to model the dry period (maximum number of consecutive days with precipitation less than 7mm for the period between January and February) for the critical grain lling stage of soybean in ve main regions (Central West South Central, North Central, West and Southwest) producing state of Parana. Through the Kolmogorov-Smirnov, at 5 % level of signicance, the Gumbel distribution was best tted the data of each regions and therefore the probability of extreme values of drought over 5, 25, 35 and 45 days, the return period for the highest values in each and levels return for the period of 5, 25, 50 and 75 years were calculated.
|
author2 |
Vitor Augusto Ozaki |
author_facet |
Vitor Augusto Ozaki Gláucia Tatiana Ferrari |
author |
Gláucia Tatiana Ferrari |
author_sort |
Gláucia Tatiana Ferrari |
title |
Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola
|
title_short |
Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola
|
title_full |
Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola
|
title_fullStr |
Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola
|
title_full_unstemmed |
Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola
|
title_sort |
imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola |
publisher |
Universidade de São Paulo |
publishDate |
2011 |
url |
http://www.teses.usp.br/teses/disponiveis/11/11134/tde-28062011-103251/ |
work_keys_str_mv |
AT glauciatatianaferrari imputacaodedadospluviometricosesuaaplicacaonamodelagemdeeventosextremosdesecaagricola AT glauciatatianaferrari imputationofrainfalldataanditsapplicationinmodelingextremeeventsofagriculturaldrought |
_version_ |
1718906886785335296 |
spelling |
ndltd-IBICT-oai-teses.usp.br-tde-28062011-1032512019-01-21T23:25:33Z Imputação de dados pluviométricos e sua aplicação na modelagem de eventos extremos de seca agrícola Imputation of rainfall data and its application in modeling extreme events of agricultural drought Gláucia Tatiana Ferrari Vitor Augusto Ozaki Ramiro Ruiz Cárdenas Silvio Sandoval Zocchi Banco de dados Controle de qualidade Estações meteorológicas Modelagem de dados Pluviometria Precipitação atmosférica Seca Data Modeling Database Drought. Precipitation Quality control Rainfall Weather stations Este trabalho relata o procedimento utilizado na obtenção de um banco de dados contínuo de precipitação diária de estações meteorológicas localizadas no Estado do Paraná. O banco de dados é composto por 484 séries históricas com dados entre janeiro de 1975 a dezembro de 2009. Para preencher os dados faltantes do banco de dados foram testados três métodos de imputação: o vizinho mais próximo, distância inversa ponderada e regressão linear. A raiz do erro quadrático médio (REQM) foi utilizada para comparar os métodos e o método da distância inversa ponderada proporcionou o melhor resultado. Após a imputação, os dados passaram por um processo de controle de qualidade que teve como objetivo identificar possíveis erros como precipitação idêntica em sete dias consecutivos (não aplicados a dados de precipitação zero) e valores de precipitação que diferem significativamente dos valores em estações meteorológicas vizinhas. Neste processo foram substituídos 1,21% valores de precipitação. Com o banco de dados contínuo, o interesse foi utilizar a teoria de valores extremos para modelar o período seco (número máximo de dias consecutivos com precipitação abaixo de 7mm para o período entre janeiro e fevereiro) crítico para a fase de enchimento de grãos da soja nas cinco principais mesorregiões (Centro Ocidental, Centro Sul, Norte Central, Oeste e Sudoeste) produtoras do Estado do Paraná. Pelo teste de Kolmogorov-Smirnov, ao nível de 5% de significância, a distribuição Gumbel foi a que melhor se ajustou aos dados de cada mesorregião e assim, a probabilidade de ocorrência de valores extremos de seca acima de 5, 25, 35 e 45 dias, o período de retorno para os maiores valores registrados em cada mesorregião e os níveis de retorno para o período de 5, 25, 50 e 75 anos foram calculados. This paper describes the procedure used to obtain a continuous database of daily precipitation from weather stations located in the state of Parana. The database consists of 484 time series with data from January 1975 to December 2009. To complete missing data from the database were tested three imputation methods: the nearest neighbour, inverse distance weighting and linear regression. The root mean square error (RMSE) was used to compare the methods and the inverse distance weighting method yielded better results. After imputing the data went through a process of quality control that aimed to identify possible errors as precipitation identical in seven consecutive days (not applied to precipitation data zero) and precipitation values that dier signicantly from the values in neighboring meteorological stations. In this process were replaced 1.21 % values of precipitation. With a continuous database, the interest was to use the Extreme Value Theory to model the dry period (maximum number of consecutive days with precipitation less than 7mm for the period between January and February) for the critical grain lling stage of soybean in ve main regions (Central West South Central, North Central, West and Southwest) producing state of Parana. Through the Kolmogorov-Smirnov, at 5 % level of signicance, the Gumbel distribution was best tted the data of each regions and therefore the probability of extreme values of drought over 5, 25, 35 and 45 days, the return period for the highest values in each and levels return for the period of 5, 25, 50 and 75 years were calculated. 2011-06-17 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/11/11134/tde-28062011-103251/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Agronomia (Estatística e Experimentação Agronômica) USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP |