Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão
Uma suposição muito comum na análise de modelos de regressão é a de respostas independentes. No entanto, quando trabalhamos com dados longitudinais ou agrupados essa suposição pode não fazer sentido. Para resolver esse problema existem diversas metodologias, e talvez a mais conhecida, no context...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade de São Paulo
2016
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/45/45133/tde-06072017-122423/ |
id |
ndltd-IBICT-oai-teses.usp.br-tde-06072017-122423 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-teses.usp.br-tde-06072017-1224232019-01-22T01:14:19Z Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão Generalized estimating equations with negative binomial responses: modeling correlated count data with overdispersion Clarissa Cardoso Oesselmann Gilberto Alvarenga Paula Denise Aparecida Botter Maria Kelly Venezuela Binomial negativa Dados de contagem Equações de estimação generalizadas Sobredispersão Count Data Generalized Estimating Equations Negative Binomial Overdispersion Uma suposição muito comum na análise de modelos de regressão é a de respostas independentes. No entanto, quando trabalhamos com dados longitudinais ou agrupados essa suposição pode não fazer sentido. Para resolver esse problema existem diversas metodologias, e talvez a mais conhecida, no contexto não Gaussiano, é a metodologia de Equações de Estimação Generalizadas (EEGs), que possui similaridades com os Modelos Lineares Generalizados (MLGs). Essas similaridades envolvem a classificação do modelo em torno de distribuições da família exponencial e da especificação de uma função de variância. A única diferença é que nessa função também é inserida uma matriz trabalho que inclui a parametrização da estrutura de correlação dentro das unidades experimentais. O principal objetivo desta dissertação é estudar como esses modelos se comportam em uma situação específica, de dados de contagem com sobredispersão. Quando trabalhamos com MLGs esse problema é resolvido através do ajuste de um modelo com resposta binomial negativa (BN), e a ideia é a mesma para os modelos envolvendo EEGs. Essa dissertação visa rever as teorias existentes em EEGs no geral e para o caso específico quando a resposta marginal é BN, e além disso mostrar como essa metodologia se aplica na prática, com três exemplos diferentes de dados correlacionados com respostas de contagem. An assumption that is common in the analysis of regression models is that of independent responses. However, when working with longitudinal or grouped data this assumption may not have sense. To solve this problem there are several methods, but perhaps the best known, in the non Gaussian context, is the one based on Generalized Estimating Equations (GEE), which has similarities with Generalized Linear Models (GLM). Such similarities involve the classification of the model around the exponential family and the specification of a variance function. The only diference is that in this function is also inserted a working correlation matrix concerning the correlations within the experimental units. The main objective of this dissertation is to study how these models behave in a specific situation, which is the one on count data with overdispersion. When we work with GLM this kind of problem is solved by setting a model with a negative binomial response (NB), and the idea is the same for the GEE methodology. This dissertation aims to review in general the GEE methodology and for the specific case when the responses follow marginal negative binomial distributions. In addition, we show how this methodology is applied in practice, with three examples of correlated data with count responses. 2016-12-12 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/45/45133/tde-06072017-122423/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Estatística USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Binomial negativa
Dados de contagem Equações de estimação generalizadas Sobredispersão Count Data Generalized Estimating Equations Negative Binomial Overdispersion |
spellingShingle |
Binomial negativa
Dados de contagem Equações de estimação generalizadas Sobredispersão Count Data Generalized Estimating Equations Negative Binomial Overdispersion Clarissa Cardoso Oesselmann Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão |
description |
Uma suposição muito comum na análise de modelos de regressão é a de respostas independentes. No entanto, quando trabalhamos com dados longitudinais ou agrupados essa suposição pode não fazer sentido. Para resolver esse problema existem diversas metodologias, e talvez a mais conhecida, no contexto não Gaussiano, é a metodologia de Equações de Estimação Generalizadas (EEGs), que possui similaridades com os Modelos Lineares Generalizados (MLGs). Essas similaridades envolvem a classificação do modelo em torno de distribuições da família exponencial e da especificação de uma função de variância. A única diferença é que nessa função também é inserida uma matriz trabalho que inclui a parametrização da estrutura de correlação dentro das unidades experimentais. O principal objetivo desta dissertação é estudar como esses modelos se comportam em uma situação específica, de dados de contagem com sobredispersão. Quando trabalhamos com MLGs esse problema é resolvido através do ajuste de um modelo com resposta binomial negativa (BN), e a ideia é a mesma para os modelos envolvendo EEGs. Essa dissertação visa rever as teorias existentes em EEGs no geral e para o caso específico quando a resposta marginal é BN, e além disso mostrar como essa metodologia se aplica na prática, com três exemplos diferentes de dados correlacionados com respostas de contagem.
===
An assumption that is common in the analysis of regression models is that of independent responses. However, when working with longitudinal or grouped data this assumption may not have sense. To solve this problem there are several methods, but perhaps the best known, in the non Gaussian context, is the one based on Generalized Estimating Equations (GEE), which has similarities with Generalized Linear Models (GLM). Such similarities involve the classification of the model around the exponential family and the specification of a variance function. The only diference is that in this function is also inserted a working correlation matrix concerning the correlations within the experimental units. The main objective of this dissertation is to study how these models behave in a specific situation, which is the one on count data with overdispersion. When we work with GLM this kind of problem is solved by setting a model with a negative binomial response (NB), and the idea is the same for the GEE methodology. This dissertation aims to review in general the GEE methodology and for the specific case when the responses follow marginal negative binomial distributions. In addition, we show how this methodology is applied in practice, with three examples of correlated data with count responses.
|
author2 |
Gilberto Alvarenga Paula |
author_facet |
Gilberto Alvarenga Paula Clarissa Cardoso Oesselmann |
author |
Clarissa Cardoso Oesselmann |
author_sort |
Clarissa Cardoso Oesselmann |
title |
Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão
|
title_short |
Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão
|
title_full |
Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão
|
title_fullStr |
Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão
|
title_full_unstemmed |
Equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão
|
title_sort |
equações de estimação generalizadas com resposta binomial negativa: modelando dados correlacionados de contagem com sobredispersão |
publisher |
Universidade de São Paulo |
publishDate |
2016 |
url |
http://www.teses.usp.br/teses/disponiveis/45/45133/tde-06072017-122423/ |
work_keys_str_mv |
AT clarissacardosooesselmann equacoesdeestimacaogeneralizadascomrespostabinomialnegativamodelandodadoscorrelacionadosdecontagemcomsobredispersao AT clarissacardosooesselmann generalizedestimatingequationswithnegativebinomialresponsesmodelingcorrelatedcountdatawithoverdispersion |
_version_ |
1718932266966581248 |