Summary: | O processo de Mineração de Dados inicia-se com o entendimento do domínio da aplicação, considerando aspectos como os objetivos da aplicação e as fontes de dados. Em seguida, é realizado o pré-processamento dos dados e a extração de padrões. Após a etapa de extração de padrões, vem a de pós-processamento, na qual o conhecimento é avaliado quanto a sua qualidade e/ou utilidade a fim de ser utilizado para apoio a algum processo de tomada de decisão. Recentemente, as pesquisas têm se voltado para problemas de regressão, porém a regressão em Mineração de Dados preditiva é uma questão pouco explorada dentro do processo de extração de conhecimento de bases de dados, sendo de grande relevância o estudo de métodos para a exploração de tarefas desse tipo. Alguns trabalhos vêm sendo realizados no Laboratório de Inteligência Computacional (LABIC) em temas relacionados ao processo de Extração de Conhecimento de Bases de Dados e Textos e na construção de um ambiente computacional para extração de conhecimento de dados denominado DlSCOVER. Para apoiar a construção de um modelo de regressão simbólico e o pós-processamento de problemas de regressão foi proposto e desenvolvido o Ambiente \'RTJ^FL, Esse ambiente viabiliza a avaliação de regras de regressão, inclusive disponibilizando estratégias para o cálculo da matriz de contingência e consequente utilização de todas as medidas derivadas dessa matriz para avaliação de regras de regressão; a combinação de regressores homogéneos e heterogéneos para melhorar a precisão dos regressores e a integração e poda de regras de regressão obtidas de diferentes amostras ou algoritmos. Essas funcionalidades do Ambiente íR$í\'I*PE incrementam a potencialidade do Ambiente DlSCOVER quanto ao tratamento de regressão.
===
Data Mining process begins with the understanding of the application domain, considering aspects as application objectives and data sources. Then, the data pre-processing and pattern extraction is realized. After the pattern extraction stage, one proceeds with the post-processing, in which the knowledge is evaluated as regards its quality and/or usefulness in order to use this knowledge to support a decision making process. Recently, much attention has been given to regression problems. However, regression in predictive Data Mining is a little explored subject in the knowledge discovery from database process, what makes the study of exploration methods very relevant. Some work in areas related to the Knowledge Discovery of Data and Text Bases process have been accomplished at LABIC (Laboratório de Inteligência Computacional) which motivated the construction of a computational environment for knowledge extraction called DlSCOVER. The WfnPFL environment was proposed and developed to aim the symbolic regression model construction and the regression problems post-processing, This environment makes possible the evaluation of regression rules, providing strategies for contingency table calculation and the subsequent utilization of ali measures derived from this table for regression rules evaluation. Moreover, the system also provides the combination of homogeneous and heterogeneous regressors to improve the regressor precision and the integration and pruning of regression rules obtained from different samples or algorithms. These functionalities of Ú&&PE increase the DlSCOVER potentiality in relation to regression treatmet.
|