Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices

O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variávei...

Full description

Bibliographic Details
Main Authors: Juliano Zimmer, Michel José Anzanello
Format: Article
Language:English
Published: Associação Brasileira de Engenharia de Produção (ABEPRO) 2013-01-01
Series:Production
Subjects:
Online Access:http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-65132013005000030
id doaj-d5f08d54f5fa4341961a0dc4fdbb2ce6
record_format Article
spelling doaj-d5f08d54f5fa4341961a0dc4fdbb2ce62020-11-24T20:46:26ZengAssociação Brasileira de Engenharia de Produção (ABEPRO)Production0103-65132013-01-01ahead0Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indicesJuliano ZimmerMichel José AnzanelloO grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.<br>The large volume of process variables collected from manufacturing applications has jeopardized process control activities. The Partial Least Squares (PLS) regression has been widely used for variable selection due to its ability to handle a large number of correlated and noisy variables. This paper presents a method for selecting the most relevant variables aimed at predicting product variables. For that matter, variable importance indices are developed based on PLS parameters and used to guide the elimination of noisy and irrelevant variables. Variables are then systematically removed from the dataset and the performance of the predictive model evaluated. When applied to five manufacturing datasets, the proposed method retained 31% of the original variables and yielded 6% more accurate predictions than using all original variables. Further, the proposed method outperformed the traditional Stepwise method regarding prediction accuracy.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-65132013005000030Seleção de variáveisRegressão PLSIndicador de importância das variáveisVariable selectionPLS regressionVariable importance índices
collection DOAJ
language English
format Article
sources DOAJ
author Juliano Zimmer
Michel José Anzanello
spellingShingle Juliano Zimmer
Michel José Anzanello
Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices
Production
Seleção de variáveis
Regressão PLS
Indicador de importância das variáveis
Variable selection
PLS regression
Variable importance índices
author_facet Juliano Zimmer
Michel José Anzanello
author_sort Juliano Zimmer
title Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices
title_short Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices
title_full Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices
title_fullStr Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices
title_full_unstemmed Um novo método para seleção de variáveis preditivas com base em índices de importância A new framework for predictive variable selection based on variable importance indices
title_sort um novo método para seleção de variáveis preditivas com base em índices de importância a new framework for predictive variable selection based on variable importance indices
publisher Associação Brasileira de Engenharia de Produção (ABEPRO)
series Production
issn 0103-6513
publishDate 2013-01-01
description O grande volume de variáveis coletadas em processos industriais impõe dificuldades ao controle e monitoramento de tais processos. A regressão PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de seleção de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo propõe um método para identificar o melhor subconjunto de variáveis de processo para a predição das variáveis de resposta. Indicadores de importância das variáveis são desenvolvidos a partir de parâmetros da regressão PLS e guiam a eliminação das variáveis irrelevantes. Tais índices são então testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predição do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de seleção com propósitos de predição.<br>The large volume of process variables collected from manufacturing applications has jeopardized process control activities. The Partial Least Squares (PLS) regression has been widely used for variable selection due to its ability to handle a large number of correlated and noisy variables. This paper presents a method for selecting the most relevant variables aimed at predicting product variables. For that matter, variable importance indices are developed based on PLS parameters and used to guide the elimination of noisy and irrelevant variables. Variables are then systematically removed from the dataset and the performance of the predictive model evaluated. When applied to five manufacturing datasets, the proposed method retained 31% of the original variables and yielded 6% more accurate predictions than using all original variables. Further, the proposed method outperformed the traditional Stepwise method regarding prediction accuracy.
topic Seleção de variáveis
Regressão PLS
Indicador de importância das variáveis
Variable selection
PLS regression
Variable importance índices
url http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-65132013005000030
work_keys_str_mv AT julianozimmer umnovometodoparaselecaodevariaveispreditivascombaseemindicesdeimportanciaanewframeworkforpredictivevariableselectionbasedonvariableimportanceindices
AT micheljoseanzanello umnovometodoparaselecaodevariaveispreditivascombaseemindicesdeimportanciaanewframeworkforpredictivevariableselectionbasedonvariableimportanceindices
_version_ 1716812690058379264