Ferramentas gráficas no processo de seleção de variáveis
Orientador: Luzia Aparecida Trinca === Resumo: Em problemas de regressão, na busca por um modelo parcimonioso, o pesquisador pode se deparar com adversidades, por exemplo, a existência de colinearidade entre as regressoras, dificultando a seleção de variáveis. Dessa forma, com a implementação de fer...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Botucatu,
2019
|
Subjects: | |
Online Access: | http://hdl.handle.net/11449/181782 |
id |
ndltd-UNESP-oai-www.athena.biblioteca.unesp.br-UEP01-000915708 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UNESP-oai-www.athena.biblioteca.unesp.br-UEP01-0009157082019-04-27T04:38:58Zcomputer fileporTL/UNESPRagiotto, LucasFerramentas gráficas no processo de seleção de variáveisBotucatu,2019Orientador: Luzia Aparecida TrincaResumo: Em problemas de regressão, na busca por um modelo parcimonioso, o pesquisador pode se deparar com adversidades, por exemplo, a existência de colinearidade entre as regressoras, dificultando a seleção de variáveis. Dessa forma, com a implementação de ferramentas inspiradas nas propostas de Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) no pacote mplot (Tarr et al., 2018) no software R, pode-se, gráfica e interativamente, estudar em detalhes a estabilidade e a importância de inclusão de covariáveis para a construção de modelos. Neste trabalho, medidas de estabilidade e probabilidade de inclusão de variáveis foram obtidas pelo método bootstrap. Medidas resumo de qualidade do ajuste são baseadas no critério de informação generalizado, que incorpora, como casos particulares, os critérios de informação de Akaike e o Bayesiano, e reflete a perda (associada ao ajuste de um modelo simplificado) mais uma penalização à complexidade do modelo. Ao aplicar a teoria de seleção de variáveis, utilizando as ferramentas gráficas no ajuste de um modelo de regressão linear Normal e regressão Binomial, foi possível reconhecer seu potencial e utilidade no processo de formulação de modelos, no qual a incorporação de conhecimento do especialista da área pode ser feita de maneira natural, já que o processo não é automático. Isso é mais um diferencial em relação aos métodos usuais de seleção de variáveis que também foram aplicados aos mesmos conjuntos de dados para efeito de discussã... (Resumo completo, clicar acesso eletrônico abaixo)Abstract: In regression analysis, the search of a parsimonious model can be difficult due to collinearities among variables and other problems. Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) proposed tools for model stability and variable inclusion plots that were re ned and implemented in the mplot package of Tarr et al. (2018), which allows interactive graphs and summaries of information relevant to model building. Stability measures and the probability of variable inclusion are obtained through bootstrapping. Goodness of fit measures are based on the generalized information criterion, which includes as particular cases the Akaike and Bayesian information criteria, given by a measure of loss of the fit and a penalization due to model complexity. Applying the method to t a Normal linear regression and a Binomial regression revealed its great potential and usefulness for model building, allowing expertise knowledge to be incorporated since the selection model is not automated. This is a further contrast to the usual selection methods which were also applied to the same datasets in order to discuss the differences.Sistema requerido: Adobe Acrobat ReaderBootstrapCritério de informação generalizadoRegressão linearRegressão logísticaMétodo de cercaMestreUniversidade Estadual Paulista "Júlio de Mesquita Filho" Instituto de Biociências (Campus de Botucatu).http://hdl.handle.net/11449/181782 |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Bootstrap Critério de informação generalizado Regressão linear Regressão logística Método de cerca |
spellingShingle |
Bootstrap Critério de informação generalizado Regressão linear Regressão logística Método de cerca Ragiotto, Lucas Ferramentas gráficas no processo de seleção de variáveis |
description |
Orientador: Luzia Aparecida Trinca === Resumo: Em problemas de regressão, na busca por um modelo parcimonioso, o pesquisador pode se deparar com adversidades, por exemplo, a existência de colinearidade entre as regressoras, dificultando a seleção de variáveis. Dessa forma, com a implementação de ferramentas inspiradas nas propostas de Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) no pacote mplot (Tarr et al., 2018) no software R, pode-se, gráfica e interativamente, estudar em detalhes a estabilidade e a importância de inclusão de covariáveis para a construção de modelos. Neste trabalho, medidas de estabilidade e probabilidade de inclusão de variáveis foram obtidas pelo método bootstrap. Medidas resumo de qualidade do ajuste são baseadas no critério de informação generalizado, que incorpora, como casos particulares, os critérios de informação de Akaike e o Bayesiano, e reflete a perda (associada ao ajuste de um modelo simplificado) mais uma penalização à complexidade do modelo. Ao aplicar a teoria de seleção de variáveis, utilizando as ferramentas gráficas no ajuste de um modelo de regressão linear Normal e regressão Binomial, foi possível reconhecer seu potencial e utilidade no processo de formulação de modelos, no qual a incorporação de conhecimento do especialista da área pode ser feita de maneira natural, já que o processo não é automático. Isso é mais um diferencial em relação aos métodos usuais de seleção de variáveis que também foram aplicados aos mesmos conjuntos de dados para efeito de discussã... (Resumo completo, clicar acesso eletrônico abaixo) === Abstract: In regression analysis, the search of a parsimonious model can be difficult due to collinearities among variables and other problems. Murray et al. (2013), Muller & Welsh (2010) e Jiang et al. (2009) proposed tools for model stability and variable inclusion plots that were re ned and implemented in the mplot package of Tarr et al. (2018), which allows interactive graphs and summaries of information relevant to model building. Stability measures and the probability of variable inclusion are obtained through bootstrapping. Goodness of fit measures are based on the generalized information criterion, which includes as particular cases the Akaike and Bayesian information criteria, given by a measure of loss of the fit and a penalization due to model complexity. Applying the method to t a Normal linear regression and a Binomial regression revealed its great potential and usefulness for model building, allowing expertise knowledge to be incorporated since the selection model is not automated. This is a further contrast to the usual selection methods which were also applied to the same datasets in order to discuss the differences. === Mestre |
author2 |
Universidade Estadual Paulista "Júlio de Mesquita Filho" Instituto de Biociências (Campus de Botucatu). |
author_facet |
Universidade Estadual Paulista "Júlio de Mesquita Filho" Instituto de Biociências (Campus de Botucatu). Ragiotto, Lucas |
author |
Ragiotto, Lucas |
author_sort |
Ragiotto, Lucas |
title |
Ferramentas gráficas no processo de seleção de variáveis |
title_short |
Ferramentas gráficas no processo de seleção de variáveis |
title_full |
Ferramentas gráficas no processo de seleção de variáveis |
title_fullStr |
Ferramentas gráficas no processo de seleção de variáveis |
title_full_unstemmed |
Ferramentas gráficas no processo de seleção de variáveis |
title_sort |
ferramentas gráficas no processo de seleção de variáveis |
publisher |
Botucatu, |
publishDate |
2019 |
url |
http://hdl.handle.net/11449/181782 |
work_keys_str_mv |
AT ragiottolucas ferramentasgraficasnoprocessodeselecaodevariaveis |
_version_ |
1719021093163892736 |