Regressão logística com erro de medida: comparação de métodos de estimação
Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade de São Paulo
2013
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/45/45133/tde-23082013-172348/ |
id |
ndltd-IBICT-oai-teses.usp.br-tde-23082013-172348 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-teses.usp.br-tde-23082013-1723482019-01-21T23:25:04Z Regressão logística com erro de medida: comparação de métodos de estimação Logistic regression model with measurement error: a comparison of estimation methods Agatha Sacramento Rodrigues Silvia Lopes de Paula Ferrari Mário de Castro Andrade Filho Carlos Alberto Ribeiro Diniz Calibração da regressão Estimação por máxima pseudoverossimilhança Medidas de desempenho na predição Modelo de regressão logística Modelos com erro de medida SIMEX. Logistic regression model Maximum pseudo-likelihood estimation Measurement error models Predictive measures Regression calibration estimation SIMEX estimation. Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos os métodos em relação à estimação, através do viés e da raiz do erro quadrático médio, e em relação à predição de novas observações, através das medidas de desempenho sensibilidade, especificidade, verdadeiro preditivo positivo, verdadeiro preditivo negativo, acurácia e estatística de Kolmogorov-Smirnov. Os estudos de simulação evidenciam o melhor desempenho do método de máxima pseudoverossimilhança na estimação. Para as medidas de desempenho na predição não há diferença entre os métodos de estimação. Por fim, utilizamos nossos resultados em dois conjuntos de dados reais de diferentes áreas: área médica, cujo objetivo está na estimação da razão de chances, e área financeira, cujo intuito é a predição de novas observações. We study the logistic model when explanatory variables are measured with error. Three estimation methods are presented, namely maximum pseudo-likelihood obtained through a Monte Carlo expectation-maximization type algorithm, regression calibration, SIMEX and naïve, which ignores the measurement error. These methods are compared through simulation. From the estimation point of view, we compare the different methods by evaluating their biases and root mean square errors. The predictive quality of the methods is evaluated based on sensitivity, specificity, positive and negative predictive values, accuracy and the Kolmogorov-Smirnov statistic. The simulation studies show that the best performing method is the maximum pseudo-likelihood method when the objective is to estimate the parameters. There is no difference among the estimation methods for predictive purposes. The results are illustrated in two real data sets from different application areas: medical area, whose goal is the estimation of the odds ratio, and financial area, whose goal is the prediction of new observations. 2013-06-27 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/45/45133/tde-23082013-172348/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Estatística USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Calibração da regressão
Estimação por máxima pseudoverossimilhança Medidas de desempenho na predição Modelo de regressão logística Modelos com erro de medida SIMEX. Logistic regression model Maximum pseudo-likelihood estimation Measurement error models Predictive measures Regression calibration estimation SIMEX estimation. |
spellingShingle |
Calibração da regressão
Estimação por máxima pseudoverossimilhança Medidas de desempenho na predição Modelo de regressão logística Modelos com erro de medida SIMEX. Logistic regression model Maximum pseudo-likelihood estimation Measurement error models Predictive measures Regression calibration estimation SIMEX estimation. Agatha Sacramento Rodrigues Regressão logística com erro de medida: comparação de métodos de estimação |
description |
Neste trabalho estudamos o modelo de regressão logística com erro de medida nas covariáveis. Abordamos as metodologias de estimação de máxima pseudoverossimilhança pelo algoritmo EM-Monte Carlo, calibração da regressão, SIMEX e naïve (ingênuo), método este que ignora o erro de medida. Comparamos os métodos em relação à estimação, através do viés e da raiz do erro quadrático médio, e em relação à predição de novas observações, através das medidas de desempenho sensibilidade, especificidade, verdadeiro preditivo positivo, verdadeiro preditivo negativo, acurácia e estatística de Kolmogorov-Smirnov. Os estudos de simulação evidenciam o melhor desempenho do método de máxima pseudoverossimilhança na estimação. Para as medidas de desempenho na predição não há diferença entre os métodos de estimação. Por fim, utilizamos nossos resultados em dois conjuntos de dados reais de diferentes áreas: área médica, cujo objetivo está na estimação da razão de chances, e área financeira, cujo intuito é a predição de novas observações.
===
We study the logistic model when explanatory variables are measured with error. Three estimation methods are presented, namely maximum pseudo-likelihood obtained through a Monte Carlo expectation-maximization type algorithm, regression calibration, SIMEX and naïve, which ignores the measurement error. These methods are compared through simulation. From the estimation point of view, we compare the different methods by evaluating their biases and root mean square errors. The predictive quality of the methods is evaluated based on sensitivity, specificity, positive and negative predictive values, accuracy and the Kolmogorov-Smirnov statistic. The simulation studies show that the best performing method is the maximum pseudo-likelihood method when the objective is to estimate the parameters. There is no difference among the estimation methods for predictive purposes. The results are illustrated in two real data sets from different application areas: medical area, whose goal is the estimation of the odds ratio, and financial area, whose goal is the prediction of new observations.
|
author2 |
Silvia Lopes de Paula Ferrari |
author_facet |
Silvia Lopes de Paula Ferrari Agatha Sacramento Rodrigues |
author |
Agatha Sacramento Rodrigues |
author_sort |
Agatha Sacramento Rodrigues |
title |
Regressão logística com erro de medida: comparação de métodos de estimação
|
title_short |
Regressão logística com erro de medida: comparação de métodos de estimação
|
title_full |
Regressão logística com erro de medida: comparação de métodos de estimação
|
title_fullStr |
Regressão logística com erro de medida: comparação de métodos de estimação
|
title_full_unstemmed |
Regressão logística com erro de medida: comparação de métodos de estimação
|
title_sort |
regressão logística com erro de medida: comparação de métodos de estimação |
publisher |
Universidade de São Paulo |
publishDate |
2013 |
url |
http://www.teses.usp.br/teses/disponiveis/45/45133/tde-23082013-172348/ |
work_keys_str_mv |
AT agathasacramentorodrigues regressaologisticacomerrodemedidacomparacaodemetodosdeestimacao AT agathasacramentorodrigues logisticregressionmodelwithmeasurementerroracomparisonofestimationmethods |
_version_ |
1718906533457166336 |