Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos

Ao modelar-se depósitos minerais é comum enfrentarmos o problema de estimar múltiplos atributos possivelmente correlacionados, onde algumas variáveis são amostradas menos densamente do que outras. A falta de dados impõe um problema que requer atenção antes de qualquer modelagem subsequente. Precisam...

Full description

Bibliographic Details
Main Author: Silva, Camilla Zacché da
Other Authors: Costa, Joao Felipe Coimbra Leite
Format: Others
Language:Portuguese
Published: 2018
Subjects:
Online Access:http://hdl.handle.net/10183/178441
id ndltd-IBICT-oai-lume.ufrgs.br-10183-178441
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Depositos minerais
Geoestatística
MNAR
Geologic data
Sequential gaussian simulation
Fixed transforms
Sequential gaussian cossimulation
spellingShingle Depositos minerais
Geoestatística
MNAR
Geologic data
Sequential gaussian simulation
Fixed transforms
Sequential gaussian cossimulation
Silva, Camilla Zacché da
Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
description Ao modelar-se depósitos minerais é comum enfrentarmos o problema de estimar múltiplos atributos possivelmente correlacionados, onde algumas variáveis são amostradas menos densamente do que outras. A falta de dados impõe um problema que requer atenção antes de qualquer modelagem subsequente. Precisamos, ao final, de modelos que sejam estatisticamente representativos. A maioria dos conjuntos de dados de problemas práticos são amostrados de maneira heterotópica e, para obter resultados coerentes, é preciso entender os motivos pelos quais alguns dados faltam e quais são os mecanismos que influenciaram a ausência de informações. A teoria de dados faltantes relaciona as amostras ausentes com aquelas medidas através de três mecanismos distintos: Faltante Completamente Aleatório (Missing Completely At Random - MCAR), Faltante Aleatório (Missing At Random - MAR) e Faltante Não Aleatório (Missing Not At Random - MNAR). O último mecanismo é extremamente complexo e a literatura recomenda ser tratado inicialmente como um mecanismo MAR. E após uma transformação fixa deve ser aplicada aos valores complementados para que estes se transformem em valores MNAR Embora existam métodos estatísticos clássicos para lidar com dados faltantes, tais abordagens ignoram a correlação espacial, uma característica que ocorre naturalmente em dados geológicos. A metodologia adequada para tratar com a falta de dados geológicos é a atualização bayesiana, em que se inserem valores sob mecanismo MAR considerando a correlação espacial. No presente estudo, a atualização bayesiana foi combinada com transformações fixas para tratar o mecanismo de falta de dados MNAR em dados geológicos. A transformação fixa aqui empregada é baseada no erro de inserção gerado em um cenário MAR no conjunto de dados. Assim, com o conjunto completo resultante foi utilizado em uma simulação sequencial gaussiana dos teores de uma base de dados multivariada, apresentando resultados satisfatórios, superiores aos obtidos por meio da cossimulação sequencial gaussiana, não inserindo qualquer viés no modelo final. === When modeling mineral deposits, it is common to face the problem of estimating multiple attributes possibly correlated where some variables are more densely sampled then others. Missing data imposes a problem that requires attention prior to any subsequent modeling. The later requires estimation models statistically representative. Most practical data sets are often heterotopically sampled, and to obtain coherent results one must understand the reasons why there are missing data and what are the mechanisms that cause the absence of information. The theory of missing data relates the missing samples to those measured through three different mechanisms: Missing Completely At Random (MCAR), Missing At Random (MAR), and Missing Not At Random (MNAR). The last mechanism is quite complex to deal with, and the literature recommends being treated as a MAR mechanism and after a fixed transform should be applied to the imputed values so that these turn into MNAR imputed values. Even though there are classical statistical methods to deal with missing data, such approaches ignore spatial correlation, a feature that occurs naturally in geological data. The adequate methodology to deal with missing geologic data is Bayesian Updating, which approaches the MAR mechanism and accounts for spatial correlation. In the present study, bayesian updating was used combined with fixed transforms to treat MNAR missing data mechanism in geologic data. The fixed transform herein used is based on the error of MAR imputation on the data set. The resulting complete set was then used on a sequential gaussian simulation of the grades on a multivariate data set, presenting satisfactory results, superior to those obtained through sequential gaussian cossimulation, not inserting any biases on the final model.
author2 Costa, Joao Felipe Coimbra Leite
author_facet Costa, Joao Felipe Coimbra Leite
Silva, Camilla Zacché da
author Silva, Camilla Zacché da
author_sort Silva, Camilla Zacché da
title Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
title_short Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
title_full Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
title_fullStr Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
title_full_unstemmed Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
title_sort metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos
publishDate 2018
url http://hdl.handle.net/10183/178441
work_keys_str_mv AT silvacamillazaccheda metodologiasdeinsercaodedadossobmecanismodefaltamnarparamodelagemdeteoresemdepositosmultivariadosheterotopicos
_version_ 1718786367408832512
spelling ndltd-IBICT-oai-lume.ufrgs.br-10183-1784412018-10-22T04:45:38Z Metodologias de inserção de dados sob mecanismo de falta mnar para modelagem de teores em depósitos multivariados heterotópicos Silva, Camilla Zacché da Costa, Joao Felipe Coimbra Leite Depositos minerais Geoestatística MNAR Geologic data Sequential gaussian simulation Fixed transforms Sequential gaussian cossimulation Ao modelar-se depósitos minerais é comum enfrentarmos o problema de estimar múltiplos atributos possivelmente correlacionados, onde algumas variáveis são amostradas menos densamente do que outras. A falta de dados impõe um problema que requer atenção antes de qualquer modelagem subsequente. Precisamos, ao final, de modelos que sejam estatisticamente representativos. A maioria dos conjuntos de dados de problemas práticos são amostrados de maneira heterotópica e, para obter resultados coerentes, é preciso entender os motivos pelos quais alguns dados faltam e quais são os mecanismos que influenciaram a ausência de informações. A teoria de dados faltantes relaciona as amostras ausentes com aquelas medidas através de três mecanismos distintos: Faltante Completamente Aleatório (Missing Completely At Random - MCAR), Faltante Aleatório (Missing At Random - MAR) e Faltante Não Aleatório (Missing Not At Random - MNAR). O último mecanismo é extremamente complexo e a literatura recomenda ser tratado inicialmente como um mecanismo MAR. E após uma transformação fixa deve ser aplicada aos valores complementados para que estes se transformem em valores MNAR Embora existam métodos estatísticos clássicos para lidar com dados faltantes, tais abordagens ignoram a correlação espacial, uma característica que ocorre naturalmente em dados geológicos. A metodologia adequada para tratar com a falta de dados geológicos é a atualização bayesiana, em que se inserem valores sob mecanismo MAR considerando a correlação espacial. No presente estudo, a atualização bayesiana foi combinada com transformações fixas para tratar o mecanismo de falta de dados MNAR em dados geológicos. A transformação fixa aqui empregada é baseada no erro de inserção gerado em um cenário MAR no conjunto de dados. Assim, com o conjunto completo resultante foi utilizado em uma simulação sequencial gaussiana dos teores de uma base de dados multivariada, apresentando resultados satisfatórios, superiores aos obtidos por meio da cossimulação sequencial gaussiana, não inserindo qualquer viés no modelo final. When modeling mineral deposits, it is common to face the problem of estimating multiple attributes possibly correlated where some variables are more densely sampled then others. Missing data imposes a problem that requires attention prior to any subsequent modeling. The later requires estimation models statistically representative. Most practical data sets are often heterotopically sampled, and to obtain coherent results one must understand the reasons why there are missing data and what are the mechanisms that cause the absence of information. The theory of missing data relates the missing samples to those measured through three different mechanisms: Missing Completely At Random (MCAR), Missing At Random (MAR), and Missing Not At Random (MNAR). The last mechanism is quite complex to deal with, and the literature recommends being treated as a MAR mechanism and after a fixed transform should be applied to the imputed values so that these turn into MNAR imputed values. Even though there are classical statistical methods to deal with missing data, such approaches ignore spatial correlation, a feature that occurs naturally in geological data. The adequate methodology to deal with missing geologic data is Bayesian Updating, which approaches the MAR mechanism and accounts for spatial correlation. In the present study, bayesian updating was used combined with fixed transforms to treat MNAR missing data mechanism in geologic data. The fixed transform herein used is based on the error of MAR imputation on the data set. The resulting complete set was then used on a sequential gaussian simulation of the grades on a multivariate data set, presenting satisfactory results, superior to those obtained through sequential gaussian cossimulation, not inserting any biases on the final model. 2018-05-17T02:27:20Z 2018 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10183/178441 001064392 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS