Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica

Diversos delineamentos experimentais que são aplicados correntemente tomam como base experimentos agronômicos. Esses dados experimentais são, geralmente, analisados usando-se modelos que consideram uma variância residual constante (ou homogênea), como pressuposto inicial. Entretanto, esta pressu...

Full description

Bibliographic Details
Main Author: Afrânio Márcio Corrêa Vieira
Other Authors: Clarice Garcia Borges Demetrio
Language:Portuguese
Published: Universidade de São Paulo 2009
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/11/11134/tde-10032009-082556/
id ndltd-IBICT-oai-teses.usp.br-tde-10032009-082556
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Análise de dados longitudinais
Análise de variância
Conforto térmico das construções
Cultura de tecidos
Delineamento experimental
Inferência bayesiana
Modelos lineares generalizados
Verossimilhança.
Analysis of variance
Bayesian inference
Cultura de tecidos
Experimental design
Generalized linear models
Likelihood.
Longitudinal data analysis
Thermal comfort of buildings
spellingShingle Análise de dados longitudinais
Análise de variância
Conforto térmico das construções
Cultura de tecidos
Delineamento experimental
Inferência bayesiana
Modelos lineares generalizados
Verossimilhança.
Analysis of variance
Bayesian inference
Cultura de tecidos
Experimental design
Generalized linear models
Likelihood.
Longitudinal data analysis
Thermal comfort of buildings
Afrânio Márcio Corrêa Vieira
Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
description Diversos delineamentos experimentais que são aplicados correntemente tomam como base experimentos agronômicos. Esses dados experimentais são, geralmente, analisados usando-se modelos que consideram uma variância residual constante (ou homogênea), como pressuposto inicial. Entretanto, esta pressuposição mostra-se relativamente forte quando se está diante de situações para as quais fatores ambientais ou externos exercem considerável influência nas medidas experimentais. Neste trabalho, são estudados modelos para a média e a variância, simultaneamente, com a variância estruturada de duas formas: (i) por meio de um preditor linear, que permite incorporar variáveis externas e fatores de ruído e (ii) por meio de efeitos aleatórios, que permitem acomodar tanto o efeito longitudinal quanto o efeito de superdispersão, no caso de medidas binárias repetidas no tempo. A classe de modelos lineares generalizados duplos (MLGD) foi aplicada a um estudo observacional que consistiu em medir a mortalidade de frangos de corte no fim da condição de espera pré-abate. Nesse problema, é forte a evidência de que alguns fatores influenciam a variabilidade, e consequentemente, diminuem a precisão das análises inferenciais. Outro problema agronômico relevante, associado à horticultura, são os experimentos de cultura de tecidos vegetais, em que o número de explantes que regeneram são contados. Como esse tipo de experimento apresenta um grande número de parâmetros a serem estimados, comparado ao tamanho da amostra, os modelos existente podem gerar estimativas questionáveis ou até levar a conclusões erroneas, uma vez esse que são baseados em grandes amostras para se fazer inferência estatística. Foi proposto um modelo linear generalizados duplo, para os dados de proporções, de uma perspectiva Bayesiana, visando a análise estatística sob pequenas amostras e a incorporação do conhecimento especialista no processo de estimação dos parâmetros. Um problema clínico, que envolve dados binários medidos repetidamente no tempo é apresentado e são propostos dois modelos que acomodam o efeito da superdispersão e a dependência longitudinal das medidas, utilizandos-se efeitos aleatórios. Foram obtidos resultados satisfatórios nos três problemas estudados. Os MLGD permitiram identificar os fatores associados à mortalidade das aves de corte, o que permitirá minimizar perdas e habilitar os processos de manejo, transporte e abate aos critérios de bem-estar animal e exigências da comunidade européia. O MLGD Bayesiano permitiu identificar o genótipo associado ao efeito de superdispersão, aumentando a precisão da inferência de seleção de variedades. Dois modelos combinados foram propostos logit-normal-Bernoulli-beta e o probit-normal-Bernoulli-beta, que acomodaram satisfatoriamente a superdispersão e a dependência longitudinal das medidas binárias. Esses resultados reforçam a importância de se modelar a média e a variância conjuntamente, o que aumenta a precisão na pesquisa agronômica, tanto em estudos experimentais quanto em estudos observacionais. === Several experimental designs that are currently applied are based on agricultural experiments. These experimental data are, usually, analised with statistical models that assume constant residual variance (or homogeneous), as basic assumption. However, this assumption shows hard to stand for, when environmental or external factors exert strong influence over the measurements. In this work, we study the joint modelling for the mean and the variance, the latter being structured on two ways: (i) through a linear predictor, which allows the incorporation of external variables and/or noise factors and (ii) by the use of random effects, that accommodate jointly the possible overdispersion effect and the dependence of longitudinal data in the case of binary measusurements taken over time. The class of double generalized linear models (DGLM) was applied to an observational study where the poultry mortality was measured in the preslaughter operations. With this situation, it can be observed that there is a strong influence from some environmental factors over the variability observed, and consequently, this reduces the precision of the inferential analysis. Another relevant agricultural problem, related to horticulture, is the tissue culture experiments, where the number of regenerated explants is counted. Usually, this kind of experiment use a large number of parameters to be estimated, when compared with the sample size. The current frequentist models are based on large samples for statistical inference and, under this experimental condition, can generate unreliable estimates or even lead to erroneous conclusions. A double generalized linear model was proposed to analyse proportion data, under the Bayesian perspective, which can be applied to small samples and can incorporate expert knowledge into the parameter estimation process. One clinical research, that measured binary data repeatedly through the time is presented and two models are proposed to fit the overdispersion effect and the dependence of longitudinal measurements, using random effects. It was obtained satisfactory results under these three problems studied. the DGLM allowed to identify factors associated with the poultry mortality, that will allow to minimize loss and improve the process, since the catching until lairage on slaughterhouse, agreeing with animal welfare criteria and the European community rules. The Bayesian DGLM allowed to identify the genotype associated with the overdispersion effect, increasing the precision on the inference about varieties selection. Two combined models were proposed, a logit-normal- Bernoulli-beta and a probit-normal-Bernoulli-beta, which have both addressed the overdispersion effect and the longitudinal dependence of the binary measurements. These results reinforce the importance to modelling mean and dispersion jointly, as a way to increase the precision of agricultural experimentation, be it on experimental studies or observational studies.
author2 Clarice Garcia Borges Demetrio
author_facet Clarice Garcia Borges Demetrio
Afrânio Márcio Corrêa Vieira
author Afrânio Márcio Corrêa Vieira
author_sort Afrânio Márcio Corrêa Vieira
title Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
title_short Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
title_full Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
title_fullStr Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
title_full_unstemmed Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
title_sort modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica
publisher Universidade de São Paulo
publishDate 2009
url http://www.teses.usp.br/teses/disponiveis/11/11134/tde-10032009-082556/
work_keys_str_mv AT afraniomarciocorreavieira modelagemsimultaneademediaedispersaoeaplicacoesnapesquisaagronomica
AT afraniomarciocorreavieira jointmodelingofmeananddispersionandapplicationstoagriculturalresearch
_version_ 1718932310964830208
spelling ndltd-IBICT-oai-teses.usp.br-tde-10032009-0825562019-01-22T01:14:28Z Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica Joint modeling of mean and dispersion and applications to agricultural research Afrânio Márcio Corrêa Vieira Clarice Garcia Borges Demetrio Cecilia Candolo Roseli Aparecida Leandro Edmilson Rodrigues Pinto Silvio Sandoval Zocchi Análise de dados longitudinais Análise de variância Conforto térmico das construções Cultura de tecidos Delineamento experimental Inferência bayesiana Modelos lineares generalizados Verossimilhança. Analysis of variance Bayesian inference Cultura de tecidos Experimental design Generalized linear models Likelihood. Longitudinal data analysis Thermal comfort of buildings Diversos delineamentos experimentais que são aplicados correntemente tomam como base experimentos agronômicos. Esses dados experimentais são, geralmente, analisados usando-se modelos que consideram uma variância residual constante (ou homogênea), como pressuposto inicial. Entretanto, esta pressuposição mostra-se relativamente forte quando se está diante de situações para as quais fatores ambientais ou externos exercem considerável influência nas medidas experimentais. Neste trabalho, são estudados modelos para a média e a variância, simultaneamente, com a variância estruturada de duas formas: (i) por meio de um preditor linear, que permite incorporar variáveis externas e fatores de ruído e (ii) por meio de efeitos aleatórios, que permitem acomodar tanto o efeito longitudinal quanto o efeito de superdispersão, no caso de medidas binárias repetidas no tempo. A classe de modelos lineares generalizados duplos (MLGD) foi aplicada a um estudo observacional que consistiu em medir a mortalidade de frangos de corte no fim da condição de espera pré-abate. Nesse problema, é forte a evidência de que alguns fatores influenciam a variabilidade, e consequentemente, diminuem a precisão das análises inferenciais. Outro problema agronômico relevante, associado à horticultura, são os experimentos de cultura de tecidos vegetais, em que o número de explantes que regeneram são contados. Como esse tipo de experimento apresenta um grande número de parâmetros a serem estimados, comparado ao tamanho da amostra, os modelos existente podem gerar estimativas questionáveis ou até levar a conclusões erroneas, uma vez esse que são baseados em grandes amostras para se fazer inferência estatística. Foi proposto um modelo linear generalizados duplo, para os dados de proporções, de uma perspectiva Bayesiana, visando a análise estatística sob pequenas amostras e a incorporação do conhecimento especialista no processo de estimação dos parâmetros. Um problema clínico, que envolve dados binários medidos repetidamente no tempo é apresentado e são propostos dois modelos que acomodam o efeito da superdispersão e a dependência longitudinal das medidas, utilizandos-se efeitos aleatórios. Foram obtidos resultados satisfatórios nos três problemas estudados. Os MLGD permitiram identificar os fatores associados à mortalidade das aves de corte, o que permitirá minimizar perdas e habilitar os processos de manejo, transporte e abate aos critérios de bem-estar animal e exigências da comunidade européia. O MLGD Bayesiano permitiu identificar o genótipo associado ao efeito de superdispersão, aumentando a precisão da inferência de seleção de variedades. Dois modelos combinados foram propostos logit-normal-Bernoulli-beta e o probit-normal-Bernoulli-beta, que acomodaram satisfatoriamente a superdispersão e a dependência longitudinal das medidas binárias. Esses resultados reforçam a importância de se modelar a média e a variância conjuntamente, o que aumenta a precisão na pesquisa agronômica, tanto em estudos experimentais quanto em estudos observacionais. Several experimental designs that are currently applied are based on agricultural experiments. These experimental data are, usually, analised with statistical models that assume constant residual variance (or homogeneous), as basic assumption. However, this assumption shows hard to stand for, when environmental or external factors exert strong influence over the measurements. In this work, we study the joint modelling for the mean and the variance, the latter being structured on two ways: (i) through a linear predictor, which allows the incorporation of external variables and/or noise factors and (ii) by the use of random effects, that accommodate jointly the possible overdispersion effect and the dependence of longitudinal data in the case of binary measusurements taken over time. The class of double generalized linear models (DGLM) was applied to an observational study where the poultry mortality was measured in the preslaughter operations. With this situation, it can be observed that there is a strong influence from some environmental factors over the variability observed, and consequently, this reduces the precision of the inferential analysis. Another relevant agricultural problem, related to horticulture, is the tissue culture experiments, where the number of regenerated explants is counted. Usually, this kind of experiment use a large number of parameters to be estimated, when compared with the sample size. The current frequentist models are based on large samples for statistical inference and, under this experimental condition, can generate unreliable estimates or even lead to erroneous conclusions. A double generalized linear model was proposed to analyse proportion data, under the Bayesian perspective, which can be applied to small samples and can incorporate expert knowledge into the parameter estimation process. One clinical research, that measured binary data repeatedly through the time is presented and two models are proposed to fit the overdispersion effect and the dependence of longitudinal measurements, using random effects. It was obtained satisfactory results under these three problems studied. the DGLM allowed to identify factors associated with the poultry mortality, that will allow to minimize loss and improve the process, since the catching until lairage on slaughterhouse, agreeing with animal welfare criteria and the European community rules. The Bayesian DGLM allowed to identify the genotype associated with the overdispersion effect, increasing the precision on the inference about varieties selection. Two combined models were proposed, a logit-normal- Bernoulli-beta and a probit-normal-Bernoulli-beta, which have both addressed the overdispersion effect and the longitudinal dependence of the binary measurements. These results reinforce the importance to modelling mean and dispersion jointly, as a way to increase the precision of agricultural experimentation, be it on experimental studies or observational studies. 2009-02-10 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://www.teses.usp.br/teses/disponiveis/11/11134/tde-10032009-082556/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Agronomia (Estatística e Experimentação Agronômica) USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP