Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE

O presente trabalho utiliza as informações da Pesquisa Anual do Comércio - PAC, uma das quatro pesquisas econômicas estruturais do IBGE, para avaliar o Modelo de Imputação atual da pesquisa comparando-o com outros modelos disponíveis na literatura. Foi feito um recorte da base da PAC-IBGE dos anos d...

Full description

Bibliographic Details
Main Author: Rodrigues, João Carlos Silva
Other Authors: Barroso, Lucia Pereira
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2019
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15072019-104904/
id ndltd-usp.br-oai-teses.usp.br-tde-15072019-104904
record_format oai_dc
collection NDLTD
language pt
format Others
sources NDLTD
topic Annual Survey of Commerce of IBGE
Imputação de pesquisas econômicas
Imputation of economic surveys
Pesquisa Anual do Comércio do IBGE
Pesquisa econômica estrutural por amostra
Structural economic sample surveys
spellingShingle Annual Survey of Commerce of IBGE
Imputação de pesquisas econômicas
Imputation of economic surveys
Pesquisa Anual do Comércio do IBGE
Pesquisa econômica estrutural por amostra
Structural economic sample surveys
Rodrigues, João Carlos Silva
Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE
description O presente trabalho utiliza as informações da Pesquisa Anual do Comércio - PAC, uma das quatro pesquisas econômicas estruturais do IBGE, para avaliar o Modelo de Imputação atual da pesquisa comparando-o com outros modelos disponíveis na literatura. Foi feito um recorte da base da PAC-IBGE dos anos de 2014 e 2015 e foram testados vinte modelos de imputação. Na PAC, tem sido observado um aumento do impacto das não-respostas nas estimativas de seus totais. Isto deriva da alta assimetria das variáveis econômicas em conjunto com o pequeno número de empresas de alguns estratos, somados ainda ao aumento populacional de algumas atividades econômicas - e, por consequência, dos pesos amostrais - e ainda do elevado número de mortes (fechamento) de empresas pequenas. Tais problemas apresentados geram a necessidade de se estudar alternativas de tratamento para essas empresas não-respondentes. Os modelos foram analisados selecionando algumas empresas aleatoriamente e assumindo que elas não tivessem respondido à pesquisa. Posteriormente, essas empresas foram submetidas aos modelos de imputação selecionados e os resultados foram avaliados utilizando Erro Quadrático Médio (EQM) e Variação Percentual (VP) dos totais estimados contra o real. Foi escolhida a variável de RECEITA para ser usada nos testes. Os modelos utilizados podem ser agrupados em quatro grupos: de médias de respondentes; através de uma regressão com uso de variáveis auxiliares de cadastro; média dos respondentes mais próximos através de uma função distância; e através de uma regressão dos respondentes mais próximos com uso de uma função distância. Ao final das análises, verificou-se que apesar de alguns modelos também terem tido bons desempenhos, não foi observado um fator relevante que indique a troca do modelo atual de imputação utilizado na PAC-IBGE. === The present work uses the information from the Annual Survey of Commerce - PAC, one of the four structural surveys of IBGE, to evaluate its current imputation model against other available models in the literature. The dataset used was obtained from PAC in the years of 2014 and 2015 and twenty imputation models were tested. At PAC, there has been an increase in the impact of non-responses on its totals estimative. This is due to the high asymmetry of the economic variables together with the small number of companies of some strata, added to the population increase of some economic activities - and, consequently, of their sample weights - and also with the high number of deaths (closure) of small businesses. Such problems present the need to study alternatives treatments for these non-responding companies. The analysis of models were made by selecting some companies randomly and assuming that they had not responded the survey. Subsequently, these companies were submitted to the selected imputation models and the results were evaluated using Mean Square Error (MSE) and the Percent Variation (PV) between the estimated totals against the real ones. The Revenue variable was the one chosen to be used in the tests. The models used can be grouped into four groups: average of the respondents; through a regression function using auxiliary variables of cadastre; average of the closest respondents through a distance function; and through a regression function of the closest respondents using a distance function. At the end of the analyzes, it was verified that although some imputation models presented good results, there is no relevant factor indicating the change of the current one.
author2 Barroso, Lucia Pereira
author_facet Barroso, Lucia Pereira
Rodrigues, João Carlos Silva
author Rodrigues, João Carlos Silva
author_sort Rodrigues, João Carlos Silva
title Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE
title_short Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE
title_full Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE
title_fullStr Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE
title_full_unstemmed Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE
title_sort avaliação de métodos de imputação na variável receita das empresas da pesquisa anual de comércio - pac-ibge
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2019
url http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15072019-104904/
work_keys_str_mv AT rodriguesjoaocarlossilva avaliacaodemetodosdeimputacaonavariavelreceitadasempresasdapesquisaanualdecomerciopacibge
AT rodriguesjoaocarlossilva anevaluationofimputationiethodsontherevenuevariablefromtheannualsurveyofcommercespacibgecompanies
_version_ 1719243715452600320
spelling ndltd-usp.br-oai-teses.usp.br-tde-15072019-1049042019-09-05T04:28:04Z Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE An evaluation of imputation iethods on the Revenue variable from the Annual Survey of Commerces (PAC-IBGE) companies Rodrigues, João Carlos Silva Annual Survey of Commerce of IBGE Imputação de pesquisas econômicas Imputation of economic surveys Pesquisa Anual do Comércio do IBGE Pesquisa econômica estrutural por amostra Structural economic sample surveys O presente trabalho utiliza as informações da Pesquisa Anual do Comércio - PAC, uma das quatro pesquisas econômicas estruturais do IBGE, para avaliar o Modelo de Imputação atual da pesquisa comparando-o com outros modelos disponíveis na literatura. Foi feito um recorte da base da PAC-IBGE dos anos de 2014 e 2015 e foram testados vinte modelos de imputação. Na PAC, tem sido observado um aumento do impacto das não-respostas nas estimativas de seus totais. Isto deriva da alta assimetria das variáveis econômicas em conjunto com o pequeno número de empresas de alguns estratos, somados ainda ao aumento populacional de algumas atividades econômicas - e, por consequência, dos pesos amostrais - e ainda do elevado número de mortes (fechamento) de empresas pequenas. Tais problemas apresentados geram a necessidade de se estudar alternativas de tratamento para essas empresas não-respondentes. Os modelos foram analisados selecionando algumas empresas aleatoriamente e assumindo que elas não tivessem respondido à pesquisa. Posteriormente, essas empresas foram submetidas aos modelos de imputação selecionados e os resultados foram avaliados utilizando Erro Quadrático Médio (EQM) e Variação Percentual (VP) dos totais estimados contra o real. Foi escolhida a variável de RECEITA para ser usada nos testes. Os modelos utilizados podem ser agrupados em quatro grupos: de médias de respondentes; através de uma regressão com uso de variáveis auxiliares de cadastro; média dos respondentes mais próximos através de uma função distância; e através de uma regressão dos respondentes mais próximos com uso de uma função distância. Ao final das análises, verificou-se que apesar de alguns modelos também terem tido bons desempenhos, não foi observado um fator relevante que indique a troca do modelo atual de imputação utilizado na PAC-IBGE. The present work uses the information from the Annual Survey of Commerce - PAC, one of the four structural surveys of IBGE, to evaluate its current imputation model against other available models in the literature. The dataset used was obtained from PAC in the years of 2014 and 2015 and twenty imputation models were tested. At PAC, there has been an increase in the impact of non-responses on its totals estimative. This is due to the high asymmetry of the economic variables together with the small number of companies of some strata, added to the population increase of some economic activities - and, consequently, of their sample weights - and also with the high number of deaths (closure) of small businesses. Such problems present the need to study alternatives treatments for these non-responding companies. The analysis of models were made by selecting some companies randomly and assuming that they had not responded the survey. Subsequently, these companies were submitted to the selected imputation models and the results were evaluated using Mean Square Error (MSE) and the Percent Variation (PV) between the estimated totals against the real ones. The Revenue variable was the one chosen to be used in the tests. The models used can be grouped into four groups: average of the respondents; through a regression function using auxiliary variables of cadastre; average of the closest respondents through a distance function; and through a regression function of the closest respondents using a distance function. At the end of the analyzes, it was verified that although some imputation models presented good results, there is no relevant factor indicating the change of the current one. Biblioteca Digitais de Teses e Dissertações da USP Barroso, Lucia Pereira 2019-06-07 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15072019-104904/ pt Liberar o conteúdo para acesso público.