Summary: | Os modelos de mistura são muito eficazes para analisar dados compostos por diferentes subpopulações com alocações desconhecidas ou que apresentam assimetria, multimodalidade ou curtose. Esta tese propõe relacionar a distribuição de probabilidade beta e a técnica de ajuste de modelos mistos à metodologia de modelos de mistura para que sejam adequados na análise de dados que assumem valores em um intervalo restrito conhecido e que também são caracterizados por possuírem uma estrutura de agrupamento ou hierárquica. Foram especificados os modelos de mistura beta mistos linear, com dispersão constante e variável, e não linear. Foi considerada uma abordagem bayesiana com uso de métodos de Monte Carlo via Cadeias de Markov (MCMC). Estudos de simulação foram delineados para avaliar os resultados inferenciais destes modelos em relação à acurácia da estimação pontual dos parâmetros, ao desempenho de critérios de informação na seleção do número de elementos da mistura e ao diagnóstico de identificabilidade obtido com o algoritmo data cloning. O desempenho dos modelos foi muito promissor, principalmente pela boa acurácia da estimação pontual dos parâmetros e por não haver evidências de falta de identificabilidade. Três bancos de dados reais das áreas de saúde, marketing e educação foram estudados por meio das técnicas propostas. Tanto nos estudos de simulação quanto na aplicação a dados reais se obtiveram resultados muito satisfatórios que evidenciam tanto a utilidade dos modelos desenvolvidos aos objetivos tratados quanto a potencialidade de aplicação. Ressaltando que a metodologia apresentada também pode ser aplicada e estendida a outros modelos de mistura. === Mixture models are very effective for analyzing data composed of different subpopulations with unknown allocations or with asymmetry, multimodality or kurtosis. This work proposes to link the beta probability distribution and the mixed models to the methodology of mixture models so that they are suitable to analyse data with values in a restricted and known interval and that also are characterized by having a grouping or hierarchical structure. There were specified the linear beta mixture models with random effects, with constant and varying dispersion, and also the nonlinear one with constant dispersion. It was considered a Bayesian approach using Markov Chain Monte Carlo (MCMC) methods. Simulation studies were designed to evaluate the inferential results of these models in relation to the accuracy of the parameter estimation, to the performance of information criteria in the selection of the number of elements of the mixture and to the diagnosis of identifiability obtained with the algorithm data cloning. The performance of the models was very promising, mainly due to the good accuracy of the point estimation of the parameters and because there was no evidence of lack of identifiability of the model. Three real databases of health, marketing and education were studied using the proposed techniques. In both the simulation studies and the application to real data had very satisfactory results that show both the usefulness of the models developed to the treated objectives and the potentiality of application. Note that the presented methodology can also be applied and extended to other mixing models.
|