Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus

La aparición de datos faltantes es un problema común en la mayoría de las encuestas llevadas a cabo en distintos ámbitos. Una técnica tradicional y muy conocida para el tratamiento de datos faltantes es la imputación. La mayoría de los estudios relacionados con los métodos de imputación se centran e...

Full description

Bibliographic Details
Main Authors: Muñoz Rosas, Juan Francisco, Alvarez Verdejo, Encarnación
Format: Article
Language:English
Published: Pablo de Olavide University 2009-01-01
Series:Revista de Métodos Cuantitativos para la Economía y la Empresa
Subjects:
Online Access:http://www.upo.es/RevMetCuant/art25.pdf
id doaj-69763b05a8504624a32e0a6524fe3ab8
record_format Article
spelling doaj-69763b05a8504624a32e0a6524fe3ab82020-11-24T23:00:52ZengPablo de Olavide UniversityRevista de Métodos Cuantitativos para la Economía y la Empresa1886-516X2009-01-0171330Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/SplusMuñoz Rosas, Juan FranciscoAlvarez Verdejo, EncarnaciónLa aparición de datos faltantes es un problema común en la mayoría de las encuestas llevadas a cabo en distintos ámbitos. Una técnica tradicional y muy conocida para el tratamiento de datos faltantes es la imputación. La mayoría de los estudios relacionados con los métodos de imputación se centran en el problema de la estimación de la media y su varianza y están basados en diseños muestrales simples tales como el muestreo aleatorio simple. En este trabajo se describen los métodos de imputación más conocidos y se plantean bajo el contexto de un diseño muestral general y para el caso de diferentes mecanismos de respuesta. Mediante estudios de simulación Monte Carlo basados en datos reales extraídos del ámbito de la economía y la empresa, analizamos las propiedades de varios métodos de imputación en la estimación de otros parámetros que también son utilizados con frecuencia en la práctica, como son las funciones de distribución y los cuantiles. Con el fin de que los métodos de imputación descritos en este trabajo se puedan implementar y usar con mayor facilidad, se proporcionan sus códigos en los lenguajes de programación R y Splus. = Missing values are a common problem in many sampling surveys, and imputation is usually employed to compensate for non-response. Most imputation methods are based upon the problem of the mean estimation and its variance, and they also assume simple sampling designs such as the simple random sampling without replacement. In this paper we describe some imputation methods and define them under a general sampling design. Different response mechanisms are also discussed. Assuming some populations based upon real data extracted from the context of the economy and business, Monte Carlo simulations are carried out to analyze the properties of the various imputation methods in the estimation of parameters such as distribution functions and quantiles. The various imputation methods are implemented using the popular statistical softwares R and Splus, and codes are here presented.http://www.upo.es/RevMetCuant/art25.pdfinformación auxiliarencuestaprobabilidades de inclusiónmecanismo de respuestaauxiliary informationsurveyinclusion probabilitiesresponse mechanism
collection DOAJ
language English
format Article
sources DOAJ
author Muñoz Rosas, Juan Francisco
Alvarez Verdejo, Encarnación
spellingShingle Muñoz Rosas, Juan Francisco
Alvarez Verdejo, Encarnación
Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus
Revista de Métodos Cuantitativos para la Economía y la Empresa
información auxiliar
encuesta
probabilidades de inclusión
mecanismo de respuesta
auxiliary information
survey
inclusion probabilities
response mechanism
author_facet Muñoz Rosas, Juan Francisco
Alvarez Verdejo, Encarnación
author_sort Muñoz Rosas, Juan Francisco
title Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus
title_short Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus
title_full Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus
title_fullStr Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus
title_full_unstemmed Métodos de imputación para el tratamiento de datos faltantes: aplicación mediante R/Splus = Imputation methods to handle the problem of missing data: an application using R/Splus
title_sort métodos de imputación para el tratamiento de datos faltantes: aplicación mediante r/splus = imputation methods to handle the problem of missing data: an application using r/splus
publisher Pablo de Olavide University
series Revista de Métodos Cuantitativos para la Economía y la Empresa
issn 1886-516X
publishDate 2009-01-01
description La aparición de datos faltantes es un problema común en la mayoría de las encuestas llevadas a cabo en distintos ámbitos. Una técnica tradicional y muy conocida para el tratamiento de datos faltantes es la imputación. La mayoría de los estudios relacionados con los métodos de imputación se centran en el problema de la estimación de la media y su varianza y están basados en diseños muestrales simples tales como el muestreo aleatorio simple. En este trabajo se describen los métodos de imputación más conocidos y se plantean bajo el contexto de un diseño muestral general y para el caso de diferentes mecanismos de respuesta. Mediante estudios de simulación Monte Carlo basados en datos reales extraídos del ámbito de la economía y la empresa, analizamos las propiedades de varios métodos de imputación en la estimación de otros parámetros que también son utilizados con frecuencia en la práctica, como son las funciones de distribución y los cuantiles. Con el fin de que los métodos de imputación descritos en este trabajo se puedan implementar y usar con mayor facilidad, se proporcionan sus códigos en los lenguajes de programación R y Splus. = Missing values are a common problem in many sampling surveys, and imputation is usually employed to compensate for non-response. Most imputation methods are based upon the problem of the mean estimation and its variance, and they also assume simple sampling designs such as the simple random sampling without replacement. In this paper we describe some imputation methods and define them under a general sampling design. Different response mechanisms are also discussed. Assuming some populations based upon real data extracted from the context of the economy and business, Monte Carlo simulations are carried out to analyze the properties of the various imputation methods in the estimation of parameters such as distribution functions and quantiles. The various imputation methods are implemented using the popular statistical softwares R and Splus, and codes are here presented.
topic información auxiliar
encuesta
probabilidades de inclusión
mecanismo de respuesta
auxiliary information
survey
inclusion probabilities
response mechanism
url http://www.upo.es/RevMetCuant/art25.pdf
work_keys_str_mv AT munozrosasjuanfrancisco metodosdeimputacionparaeltratamientodedatosfaltantesaplicacionmediantersplusimputationmethodstohandletheproblemofmissingdataanapplicationusingrsplus
AT alvarezverdejoencarnacion metodosdeimputacionparaeltratamientodedatosfaltantesaplicacionmediantersplusimputationmethodstohandletheproblemofmissingdataanapplicationusingrsplus
_version_ 1725641011183484928