A ordenação das variáveis no processo de otimização de classificadores bayesianos: uma abordagem evolutiva

Made available in DSpace on 2016-06-02T19:05:27Z (GMT). No. of bitstreams: 1 1649.pdf: 1564885 bytes, checksum: e8028ca33a6f5d6183ac9df67a8c1ae9 (MD5) Previous issue date: 2007-08-20 === Classification is a basic task in data analysis and pattern recognition that requires the construction of a c...

Full description

Bibliographic Details
Main Author: Santos, Edimilson Batista dos
Other Authors: Hruschka Júnior, Estevam Rafael
Format: Others
Language:Portuguese
Published: Universidade Federal de São Carlos 2016
Subjects:
Online Access:https://repositorio.ufscar.br/handle/ufscar/361
Description
Summary:Made available in DSpace on 2016-06-02T19:05:27Z (GMT). No. of bitstreams: 1 1649.pdf: 1564885 bytes, checksum: e8028ca33a6f5d6183ac9df67a8c1ae9 (MD5) Previous issue date: 2007-08-20 === Classification is a basic task in data analysis and pattern recognition that requires the construction of a classifier. The induction of classifiers from data sets is an important problem in machine learning. Numerous approaches to this problem are based on various representations such as decision trees, neural networks, decision graphs, and rules. However the interest in Bayesianos methods for classification has grown sufficiently. Bayesian Networks (BNs) learning algorithms can be used to induce Bayesian classifiers. However, BNs learning from data is known to be a NP problem and does not have computational methods capable to identify to the best solution for all the application problems. A very common restriction when learning a BN is the definition of a previous Variables Ordering (OV). The OV represent the possible relationships between the variables in the formation of the structure of BN that describes the problem. Using an adequate OV, learning algorithms are capable to find a solution more efficient. Therefore, this work proposes hybrid approaches to help the process of learning a BN from data for classification. The proposed methods named VOGA, VOGAC e VOEA uses Evolutionary Algorithms to optimize the BN learning process by means of the identification of an adequate variables ordering. These methods use information about the class variable when defining the most suitable variable ordering. Experiments performed in a number of datasets revealed that methods are promising === Classificação é uma tarefa importante em análises de dados e reconhecimento de padrões e requer a construção de um classificador. A indução de classificadores a partir de um conjunto de dados é um problema importante em aprendizado de máquina. Diversas abordagens para a resolução deste problema se baseiam em várias representações, como árvores de decisão, redes neurais, grafos de decisão e regras. Entretanto, têm crescido bastante o interesse em métodos Bayesianos para classificação. Os algoritmos de aprendizado de redes Bayesianas podem ser usados para induzir classificadores Bayesianos. Contudo, o aprendizado de redes Bayesianas a partir de dados é um problema NP-Completo e não há métodos computacionais capazes de identificar a melhor solução para todos os problemas de aplicação. Uma restrição comum nestes algoritmos de aprendizado é a ordenação prévia das variáveis utilizadas na definição do problema. As ordenações das variáveis representam os possíveis relacionamentos entre as variáveis na formação da estrutura da rede Bayesiana que descreve o problema. Utilizando uma ordenação adequada das variáveis, os algoritmos de aprendizado são capazes de encontrar uma solução mais eficiente. Sendo assim, são propostos, neste trabalho, métodos híbridos para identificar uma ordenação adequada de variáveis, visando à otimização do aprendizado de redes Bayesianas para a tarefa de classificação. Os métodos propostos, chamados de VOGA, VOGAC e VOEA, utilizam algoritmos evolucionários e algoritmos de aprendizado de redes Bayesianas. Estes métodos usam a informação da variável classe na definição da ordenação mais adequada. Os experimentos executados em alguns domínios de bases de dados revelaram que os métodos propostos são promissores