Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica

O modelo de regressão linear com erros na família de distribuições t-assimétrica, que contempla as distribuições normal, t-Student e normal assimétrica como casos particulares, tem sido considerado uma alternativa robusta ao modelo normal. Para concluir qual modelo é, de fato, mais robusto, é im...

Full description

Bibliographic Details
Main Author: Diego Wesllen da Silva
Other Authors: Marcia D Elia Branco
Language:Portuguese
Published: Universidade de São Paulo 2017
Subjects:
CPO
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45133/tde-10082017-005536/
id ndltd-IBICT-oai-teses.usp.br-tde-10082017-005536
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Conditional predictive ordinate
CPO
Distribuição t-assimétrica
Kullback-Leibler
Medidas de influência
Norma L1
Conditional predictive ordinate
CPO
Influence measures
Kullback-Leibler
L1 norm
skew-t distribution
spellingShingle Conditional predictive ordinate
CPO
Distribuição t-assimétrica
Kullback-Leibler
Medidas de influência
Norma L1
Conditional predictive ordinate
CPO
Influence measures
Kullback-Leibler
L1 norm
skew-t distribution
Diego Wesllen da Silva
Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
description O modelo de regressão linear com erros na família de distribuições t-assimétrica, que contempla as distribuições normal, t-Student e normal assimétrica como casos particulares, tem sido considerado uma alternativa robusta ao modelo normal. Para concluir qual modelo é, de fato, mais robusto, é importante ter um método tanto para identificar uma observação como discrepante quanto aferir a influência que esta observação terá em nossas estimativas. Nos modelos de regressão bayesianos, uma das medidas de identificação de observações discrepantes mais conhecidas é a conditional predictive ordinate (CPO). Analisamos a influência dessas observações nas estimativas tanto de forma global, isto é, no vetor completo de parâmetros do modelo quanto de forma marginal, apenas nos parâmetros regressores. Consideramos a norma L1 e a divergência Kullback-Leibler como medidas de influência das observações nas estimativas dos parâmetros. Além disso, encontramos as distribuições condicionais completas de todos os modelos para o uso do algoritmo de Gibbs obtendo, assim, amostras da distribuição a posteriori dos parâmetros. Tais amostras são utilizadas no calculo do CPO e das medidas de divergência estudadas. A principal contribuição deste trabalho é obter as medidas de influência global e marginal calculadas para os modelos t-Student, normal assimétrico e t-assimétrico. Na aplicação em dados reais originais e contaminados, observamos que, em geral, o modelo t-Student é uma alternativa robusta ao modelo normal. Por outro lado, o modelo t-assimétrico não é, em geral, uma alternativa robusta ao modelo normal. A capacidade de robustificação do modelo t-assimétrico está diretamente ligada à posição do resíduo do ponto discrepante em relação a distribuição dos resíduos. === The linear regression model with errors in the skew-t family, which includes the normal, Student-t and skew normal distributions as particular cases, has been considered as a robust alternative to the normal model. To conclude which model is in fact more robust its important to have a method to identify an observation as outlier, as well as to assess the influence of this observation in the estimates. In bayesian regression models, one of the most known measures to identify an outlier is the conditional predictive ordinate (CPO). We analyze the influence of these observations on the estimates both in a global way, that is, in the complete parameter vector of the model and in a marginal way, only in the regressor parameters. We consider the L1 norm and the Kullback-Leibler divergence as influence measures of the observations on the parameter estimates. Using the bayesian approach, we find the complete conditional distributions of all the models for the usage of the Gibbs sampler thus obtaining samples of the posterior distribution of the parameters. These samples are used in the calculation of the CPO and the studied divergence measures. The major contribution of this work is to present the global and marginal influence measures calculated for the Student-t, skew normal and skew-t models. In the application on original and contaminated real data, we observed that in general the Student-t model is a robust alternative to the normal model. However, the skew-t model is not a robust alternative to the normal model. The robustification capability of the skew-t model is directly linked to the position of the residual of the outlier in relation to the distribution of the residuals.
author2 Marcia D Elia Branco
author_facet Marcia D Elia Branco
Diego Wesllen da Silva
author Diego Wesllen da Silva
author_sort Diego Wesllen da Silva
title Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
title_short Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
title_full Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
title_fullStr Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
title_full_unstemmed Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
title_sort diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica
publisher Universidade de São Paulo
publishDate 2017
url http://www.teses.usp.br/teses/disponiveis/45/45133/tde-10082017-005536/
work_keys_str_mv AT diegowesllendasilva diagnosticodeinfluenciabayesianoemmodelosderegressaodafamiliatassimetrica
AT diegowesllendasilva bayesianinfluencediagnosticinskewtfamilylinearregressionmodels
_version_ 1718906315383767040
spelling ndltd-IBICT-oai-teses.usp.br-tde-10082017-0055362019-01-21T23:25:04Z Diagnóstico de influência bayesiano em modelos de regressão da família t-assimétrica Bayesian influence diagnostic in skew-t family linear regression models Diego Wesllen da Silva Marcia D Elia Branco Luciana Graziela de Godoi Cibele Maria Russo Noveli Conditional predictive ordinate CPO Distribuição t-assimétrica Kullback-Leibler Medidas de influência Norma L1 Conditional predictive ordinate CPO Influence measures Kullback-Leibler L1 norm skew-t distribution O modelo de regressão linear com erros na família de distribuições t-assimétrica, que contempla as distribuições normal, t-Student e normal assimétrica como casos particulares, tem sido considerado uma alternativa robusta ao modelo normal. Para concluir qual modelo é, de fato, mais robusto, é importante ter um método tanto para identificar uma observação como discrepante quanto aferir a influência que esta observação terá em nossas estimativas. Nos modelos de regressão bayesianos, uma das medidas de identificação de observações discrepantes mais conhecidas é a conditional predictive ordinate (CPO). Analisamos a influência dessas observações nas estimativas tanto de forma global, isto é, no vetor completo de parâmetros do modelo quanto de forma marginal, apenas nos parâmetros regressores. Consideramos a norma L1 e a divergência Kullback-Leibler como medidas de influência das observações nas estimativas dos parâmetros. Além disso, encontramos as distribuições condicionais completas de todos os modelos para o uso do algoritmo de Gibbs obtendo, assim, amostras da distribuição a posteriori dos parâmetros. Tais amostras são utilizadas no calculo do CPO e das medidas de divergência estudadas. A principal contribuição deste trabalho é obter as medidas de influência global e marginal calculadas para os modelos t-Student, normal assimétrico e t-assimétrico. Na aplicação em dados reais originais e contaminados, observamos que, em geral, o modelo t-Student é uma alternativa robusta ao modelo normal. Por outro lado, o modelo t-assimétrico não é, em geral, uma alternativa robusta ao modelo normal. A capacidade de robustificação do modelo t-assimétrico está diretamente ligada à posição do resíduo do ponto discrepante em relação a distribuição dos resíduos. The linear regression model with errors in the skew-t family, which includes the normal, Student-t and skew normal distributions as particular cases, has been considered as a robust alternative to the normal model. To conclude which model is in fact more robust its important to have a method to identify an observation as outlier, as well as to assess the influence of this observation in the estimates. In bayesian regression models, one of the most known measures to identify an outlier is the conditional predictive ordinate (CPO). We analyze the influence of these observations on the estimates both in a global way, that is, in the complete parameter vector of the model and in a marginal way, only in the regressor parameters. We consider the L1 norm and the Kullback-Leibler divergence as influence measures of the observations on the parameter estimates. Using the bayesian approach, we find the complete conditional distributions of all the models for the usage of the Gibbs sampler thus obtaining samples of the posterior distribution of the parameters. These samples are used in the calculation of the CPO and the studied divergence measures. The major contribution of this work is to present the global and marginal influence measures calculated for the Student-t, skew normal and skew-t models. In the application on original and contaminated real data, we observed that in general the Student-t model is a robust alternative to the normal model. However, the skew-t model is not a robust alternative to the normal model. The robustification capability of the skew-t model is directly linked to the position of the residual of the outlier in relation to the distribution of the residuals. 2017-05-05 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/45/45133/tde-10082017-005536/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Estatística USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP