Regressão logística com erro de medida: comparação de métodos de estimação

Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos...

Full description

Bibliographic Details
Main Author: Agatha Sacramento Rodrigues
Other Authors: Silvia Lopes de Paula Ferrari
Language:Portuguese
Published: Universidade de São Paulo 2013
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45133/tde-23082013-172348/
id ndltd-IBICT-oai-teses.usp.br-tde-23082013-172348
record_format oai_dc
spelling ndltd-IBICT-oai-teses.usp.br-tde-23082013-1723482019-01-21T23:25:04Z Regressão logística com erro de medida: comparação de métodos de estimação Logistic regression model with measurement error: a comparison of estimation methods Agatha Sacramento Rodrigues Silvia Lopes de Paula Ferrari Mário de Castro Andrade Filho Carlos Alberto Ribeiro Diniz Calibração da regressão Estimação por máxima pseudoverossimilhança Medidas de desempenho na predição Modelo de regressão logística Modelos com erro de medida SIMEX. Logistic regression model Maximum pseudo-likelihood estimation Measurement error models Predictive measures Regression calibration estimation SIMEX estimation. Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos os métodos em relação à estimação, através do viés e da raiz do erro quadrático médio, e em relação à predição de novas observações, através das medidas de desempenho sensibilidade, especificidade, verdadeiro preditivo positivo, verdadeiro preditivo negativo, acurácia e estatística de Kolmogorov-Smirnov. Os estudos de simulação evidenciam o melhor desempenho do método de máxima pseudoverossimilhança na estimação. Para as medidas de desempenho na predição não há diferença entre os métodos de estimação. Por fim, utilizamos nossos resultados em dois conjuntos de dados reais de diferentes áreas: área médica, cujo objetivo está na estimação da razão de chances, e área financeira, cujo intuito é a predição de novas observações. We study the logistic model when explanatory variables are measured with error. Three estimation methods are presented, namely maximum pseudo-likelihood obtained through a Monte Carlo expectation-maximization type algorithm, regression calibration, SIMEX and naïve, which ignores the measurement error. These methods are compared through simulation. From the estimation point of view, we compare the different methods by evaluating their biases and root mean square errors. The predictive quality of the methods is evaluated based on sensitivity, specificity, positive and negative predictive values, accuracy and the Kolmogorov-Smirnov statistic. The simulation studies show that the best performing method is the maximum pseudo-likelihood method when the objective is to estimate the parameters. There is no difference among the estimation methods for predictive purposes. The results are illustrated in two real data sets from different application areas: medical area, whose goal is the estimation of the odds ratio, and financial area, whose goal is the prediction of new observations. 2013-06-27 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/45/45133/tde-23082013-172348/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Estatística USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP
collection NDLTD
language Portuguese
sources NDLTD
topic Calibração da regressão
Estimação por máxima pseudoverossimilhança
Medidas de desempenho na predição
Modelo de regressão logística
Modelos com erro de medida
SIMEX.
Logistic regression model
Maximum pseudo-likelihood estimation
Measurement error models
Predictive measures
Regression calibration estimation
SIMEX estimation.
spellingShingle Calibração da regressão
Estimação por máxima pseudoverossimilhança
Medidas de desempenho na predição
Modelo de regressão logística
Modelos com erro de medida
SIMEX.
Logistic regression model
Maximum pseudo-likelihood estimation
Measurement error models
Predictive measures
Regression calibration estimation
SIMEX estimation.
Agatha Sacramento Rodrigues
Regressão logística com erro de medida: comparação de métodos de estimação
description Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos os métodos em relação à estimação, através do viés e da raiz do erro quadrático médio, e em relação à predição de novas observações, através das medidas de desempenho sensibilidade, especificidade, verdadeiro preditivo positivo, verdadeiro preditivo negativo, acurácia e estatística de Kolmogorov-Smirnov. Os estudos de simulação evidenciam o melhor desempenho do método de máxima pseudoverossimilhança na estimação. Para as medidas de desempenho na predição não há diferença entre os métodos de estimação. Por fim, utilizamos nossos resultados em dois conjuntos de dados reais de diferentes áreas: área médica, cujo objetivo está na estimação da razão de chances, e área financeira, cujo intuito é a predição de novas observações. === We study the logistic model when explanatory variables are measured with error. Three estimation methods are presented, namely maximum pseudo-likelihood obtained through a Monte Carlo expectation-maximization type algorithm, regression calibration, SIMEX and naïve, which ignores the measurement error. These methods are compared through simulation. From the estimation point of view, we compare the different methods by evaluating their biases and root mean square errors. The predictive quality of the methods is evaluated based on sensitivity, specificity, positive and negative predictive values, accuracy and the Kolmogorov-Smirnov statistic. The simulation studies show that the best performing method is the maximum pseudo-likelihood method when the objective is to estimate the parameters. There is no difference among the estimation methods for predictive purposes. The results are illustrated in two real data sets from different application areas: medical area, whose goal is the estimation of the odds ratio, and financial area, whose goal is the prediction of new observations.
author2 Silvia Lopes de Paula Ferrari
author_facet Silvia Lopes de Paula Ferrari
Agatha Sacramento Rodrigues
author Agatha Sacramento Rodrigues
author_sort Agatha Sacramento Rodrigues
title Regressão logística com erro de medida: comparação de métodos de estimação
title_short Regressão logística com erro de medida: comparação de métodos de estimação
title_full Regressão logística com erro de medida: comparação de métodos de estimação
title_fullStr Regressão logística com erro de medida: comparação de métodos de estimação
title_full_unstemmed Regressão logística com erro de medida: comparação de métodos de estimação
title_sort regressão logística com erro de medida: comparação de métodos de estimação
publisher Universidade de São Paulo
publishDate 2013
url http://www.teses.usp.br/teses/disponiveis/45/45133/tde-23082013-172348/
work_keys_str_mv AT agathasacramentorodrigues regressaologisticacomerrodemedidacomparacaodemetodosdeestimacao
AT agathasacramentorodrigues logisticregressionmodelwithmeasurementerroracomparisonofestimationmethods
_version_ 1718906533457166336