RSAPP, um algoritmo baseado em rough sets para aux?lio ao processo de descoberta de conhecimento em banco de dados

Made available in DSpace on 2015-04-14T14:50:07Z (GMT). No. of bitstreams: 1 451416.pdf: 14714043 bytes, checksum: 81e6c7473cbbdc708a5b414e1b3ffc85 (MD5) Previous issue date: 2013-03-14 === Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transfor...

Full description

Bibliographic Details
Main Author: Silveira, Juliano Gomes da
Other Authors: Ruiz, Duncan Dubugras Alcoba
Format: Others
Language:Portuguese
Published: Pontif?cia Universidade Cat?lica do Rio Grande do Sul 2015
Subjects:
Online Access:http://tede2.pucrs.br/tede2/handle/tede/5237
Description
Summary:Made available in DSpace on 2015-04-14T14:50:07Z (GMT). No. of bitstreams: 1 451416.pdf: 14714043 bytes, checksum: 81e6c7473cbbdc708a5b414e1b3ffc85 (MD5) Previous issue date: 2013-03-14 === Techniques of Business Intelligence (BI) became one of the main allies of organizations in tasks of transforming data into knowledge, supporting the middle and upper management levels in decision making. BI tools in their composition are based on techniques of knowledge management, such as Data Warehouse (DW), OLAP (Online Analytical Processing), Data Mining (DM), among others. In this context, it is observed that in many case, DM projects become unfeasible by some factors, such as project costs, duration and specially the uncertainty in obtaining results that return the investment spent on the project. This work seeks to minimize these factors through a diagnosis on data, by an algorithm based on Rough Sets Theory. The algorithm, named Rough Set App (RSAPP) aims to create a diagnosis on data persisted in DW, in order to map which attributes have the greatest potential for generating more accurate mining models and more interesting results. Thus, it is expected that the diagnosis generated by RSAPP can complement the KDD (Knowledge Discovery in Database) process, reducing the time spent on activities of understanding and reducing data dimensionality. This work presents a detailed description about the implemented algorithm, as well as the report of the executed tests. At the end there is an empirical analysis of the results, in order to estimate the effectiveness of the proposed algorithm. === As t?cnicas, business intelligence (BI) firmaram-se como grandes aliadas das organiza??es nas tarefas de transformar dados em conhecimento, apoiando a m?dia e alta gest?o na tomada de decis?es. As ferramentas de BI em sua, composi??o s?o fundadas em t?cnicas de gest?o do conhecimento, tais como Data Warehouse (DW), OLAP (Online Analytical Processing), minara??o de dados (MD), entre outras. Neste contexto, observa-se que em muitos casos, projatos de MD acabam sendo inviabilizados por alguns fatores, tais como, custo do projeto, dura??o e principalmente, a incerteza na obten??o de resultados que retornem o investimento despedindo no projeto. O presente trabalho busca minimizar os fatores acima por meio um diagn?stico sobre dados, atrav?s de um algoritmo baseado em Rough Sets Theory (Teoria dos Conjuntos Aproximados (TCA)). O algoritmo desenvolvido, nomeado Rough Set App (RSAPP) objetiva criar um diagn?stico sobre os dados persistidos no DW, a fim de mapear quais atributos possuem maior potencial de gerar modelos de minera??o mais preciosos e resultados mais interessantes. Desta forma, entende-se que o diagn?stico gerado por RSAPP pode complementar o processo de KDD (Knowledge Discovery in database), reduzindo o tempo gasto nas atividades de entendimento e redu??o da dimensionalidade dos dados. No trabalho se faz uma descri??o detalhada acerca do algoritmo implementado, bem como o relato dos, testes que foram executados. Ao final faz-se uma an?lise emp?rica sobre os resultados a fim de estimar a efic?cia do algoritmo quanto a sua proposta.