Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example
INTRODUÇÃO: A perda de informações é um problema frequente em estudos realizados na área da Saúde. Na literatura essa perda é chamada de missing data ou dados faltantes. Através da imputação dos dados faltantes são criados conjuntos de dados artificialmente completos que podem ser analisados por téc...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Associação Brasileira de Pós-Graduação em Saúde Coletiva
2010-12-01
|
Series: | Revista Brasileira de Epidemiologia |
Subjects: | |
Online Access: | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1415-790X2010000400005 |
id |
doaj-817f19bc1fa843d7bf5ec9c924ec97cb |
---|---|
record_format |
Article |
spelling |
doaj-817f19bc1fa843d7bf5ec9c924ec97cb2020-11-25T01:50:52ZengAssociação Brasileira de Pós-Graduação em Saúde ColetivaRevista Brasileira de Epidemiologia1415-790X1980-54972010-12-0113459660610.1590/S1415-790X2010000400005Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as exampleLuciana Neves NunesMariza Machado KlückJandyra Maria Guimarães FachelINTRODUÇÃO: A perda de informações é um problema frequente em estudos realizados na área da Saúde. Na literatura essa perda é chamada de missing data ou dados faltantes. Através da imputação dos dados faltantes são criados conjuntos de dados artificialmente completos que podem ser analisados por técnicas estatísticas tradicionais. O objetivo desse artigo foi comparar, em um exemplo baseado em dados reais, a utilização de três técnicas de imputações diferentes. MÉTODO: Os dados utilizados referem-se a um estudo de desenvolvimento de modelo de risco cirúrgico, sendo que o tamanho da amostra foi de 450 pacientes. Os métodos de imputação empregados foram duas imputações únicas e uma imputação múltipla (IM), e a suposição sobre o mecanismo de não-resposta foi MAR (Missing at Random). RESULTADOS: A variável com dados faltantes foi a albumina sérica, com 27,1% de perda. Os modelos obtidos pelas imputações únicas foram semelhantes entre si, mas diferentes dos obtidos com os dados imputados pela IM quanto à inclusão de variáveis nos modelos. CONCLUSÕES: Os resultados indicam que faz diferença levar em conta a relação da albumina com outras variáveis observadas, pois foram obtidos modelos diferentes nas imputações única e múltipla. A imputação única subestima a variabilidade, gerando intervalos de confiança mais estreitos. É importante se considerar o uso de métodos de imputação quando há dados faltantes, especialmente a IM que leva em conta a variabilidade entre imputações para as estimativas do modelo.<br>INTRODUCTION: It is common for studies in health to face problems with missing data. Through imputation, complete data sets are built artificially and can be analyzed by traditional statistical analysis. The objective of this paper is to compare three types of imputation based on real data. METHODS: The data used came from a study on the development of risk models for surgical mortality. The sample size was 450 patients. The imputation methods applied were: two single imputations and one multiple imputation and the assumption was MAR (Missing at Random). RESULTS: The variable with missing data was serum albumin with 27.1% of missing rate. The logistic models adjusted by simple imputation were similar, but differed from models obtained by multiple imputation in relation to the inclusion of variables. CONCLUSIONS: The results indicate that it is important to take into account the relationship of albumin to other variables observed, because different models were obtained in single and multiple imputations. Single imputation underestimates the variability generating narrower confidence intervals. It is important to consider the use of imputation methods when there is missing data, especially multiple imputation that takes into account the variability between imputations for estimates of the model.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1415-790X2010000400005Métodos de imputaçãoImputação múltiplaDados faltantesNão-resposta ao acasoImputation methodsMultiple imputationMissing dataMissing at random |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Luciana Neves Nunes Mariza Machado Klück Jandyra Maria Guimarães Fachel |
spellingShingle |
Luciana Neves Nunes Mariza Machado Klück Jandyra Maria Guimarães Fachel Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example Revista Brasileira de Epidemiologia Métodos de imputação Imputação múltipla Dados faltantes Não-resposta ao acaso Imputation methods Multiple imputation Missing data Missing at random |
author_facet |
Luciana Neves Nunes Mariza Machado Klück Jandyra Maria Guimarães Fachel |
author_sort |
Luciana Neves Nunes |
title |
Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example |
title_short |
Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example |
title_full |
Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example |
title_fullStr |
Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example |
title_full_unstemmed |
Comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica Comparison of simple and multiple imputation methods using a risk model for surgical mortality as example |
title_sort |
comparação de métodos de imputação única e múltipla usando como exemplo um modelo de risco para mortalidade cirúrgica comparison of simple and multiple imputation methods using a risk model for surgical mortality as example |
publisher |
Associação Brasileira de Pós-Graduação em Saúde Coletiva |
series |
Revista Brasileira de Epidemiologia |
issn |
1415-790X 1980-5497 |
publishDate |
2010-12-01 |
description |
INTRODUÇÃO: A perda de informações é um problema frequente em estudos realizados na área da Saúde. Na literatura essa perda é chamada de missing data ou dados faltantes. Através da imputação dos dados faltantes são criados conjuntos de dados artificialmente completos que podem ser analisados por técnicas estatísticas tradicionais. O objetivo desse artigo foi comparar, em um exemplo baseado em dados reais, a utilização de três técnicas de imputações diferentes. MÉTODO: Os dados utilizados referem-se a um estudo de desenvolvimento de modelo de risco cirúrgico, sendo que o tamanho da amostra foi de 450 pacientes. Os métodos de imputação empregados foram duas imputações únicas e uma imputação múltipla (IM), e a suposição sobre o mecanismo de não-resposta foi MAR (Missing at Random). RESULTADOS: A variável com dados faltantes foi a albumina sérica, com 27,1% de perda. Os modelos obtidos pelas imputações únicas foram semelhantes entre si, mas diferentes dos obtidos com os dados imputados pela IM quanto à inclusão de variáveis nos modelos. CONCLUSÕES: Os resultados indicam que faz diferença levar em conta a relação da albumina com outras variáveis observadas, pois foram obtidos modelos diferentes nas imputações única e múltipla. A imputação única subestima a variabilidade, gerando intervalos de confiança mais estreitos. É importante se considerar o uso de métodos de imputação quando há dados faltantes, especialmente a IM que leva em conta a variabilidade entre imputações para as estimativas do modelo.<br>INTRODUCTION: It is common for studies in health to face problems with missing data. Through imputation, complete data sets are built artificially and can be analyzed by traditional statistical analysis. The objective of this paper is to compare three types of imputation based on real data. METHODS: The data used came from a study on the development of risk models for surgical mortality. The sample size was 450 patients. The imputation methods applied were: two single imputations and one multiple imputation and the assumption was MAR (Missing at Random). RESULTS: The variable with missing data was serum albumin with 27.1% of missing rate. The logistic models adjusted by simple imputation were similar, but differed from models obtained by multiple imputation in relation to the inclusion of variables. CONCLUSIONS: The results indicate that it is important to take into account the relationship of albumin to other variables observed, because different models were obtained in single and multiple imputations. Single imputation underestimates the variability generating narrower confidence intervals. It is important to consider the use of imputation methods when there is missing data, especially multiple imputation that takes into account the variability between imputations for estimates of the model. |
topic |
Métodos de imputação Imputação múltipla Dados faltantes Não-resposta ao acaso Imputation methods Multiple imputation Missing data Missing at random |
url |
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1415-790X2010000400005 |
work_keys_str_mv |
AT luciananevesnunes comparacaodemetodosdeimputacaounicaemultiplausandocomoexemploummodeloderiscoparamortalidadecirurgicacomparisonofsimpleandmultipleimputationmethodsusingariskmodelforsurgicalmortalityasexample AT marizamachadokluck comparacaodemetodosdeimputacaounicaemultiplausandocomoexemploummodeloderiscoparamortalidadecirurgicacomparisonofsimpleandmultipleimputationmethodsusingariskmodelforsurgicalmortalityasexample AT jandyramariaguimaraesfachel comparacaodemetodosdeimputacaounicaemultiplausandocomoexemploummodeloderiscoparamortalidadecirurgicacomparisonofsimpleandmultipleimputationmethodsusingariskmodelforsurgicalmortalityasexample |
_version_ |
1725000078307885056 |