Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias

Resumo: A PG (Programação Genetica) e aplicada com sucesso em Classicação. Entretanto, a pesquisa voltada a aplicação de PG para OCC (One-Class Classication) encontra-se em estagios iniciais, pois os poucos trabalhos relacionados existentes estão repletos de mudancas que não foram individualmente av...

Full description

Bibliographic Details
Main Author: Cabral, Rafael da Veiga
Other Authors: Spinosa, Eduardo Jaques
Format: Others
Language:Portuguese
Published: 2012
Subjects:
Online Access:http://hdl.handle.net/1884/26537
id ndltd-IBICT-oai-dspace.c3sl.ufpr.br-1884-26537
record_format oai_dc
spelling ndltd-IBICT-oai-dspace.c3sl.ufpr.br-1884-265372018-05-23T18:27:49Z Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias Cabral, Rafael da Veiga Spinosa, Eduardo Jaques Universidade Federal do Paraná. Setor de Ciencias Exatas. Programa de Pós-Graduaçao em Informática Teses Programação genética (Computação) Algoritmos geneticos Classificação (Computadores) Resumo: A PG (Programação Genetica) e aplicada com sucesso em Classicação. Entretanto, a pesquisa voltada a aplicação de PG para OCC (One-Class Classication) encontra-se em estagios iniciais, pois os poucos trabalhos relacionados existentes estão repletos de mudancas que não foram individualmente avaliadas e cujos propositos estão em resolver problemas provenientes do metodo de geracão de anomalias empregado e tambem na redução do tempo computacional da etapa de treino. Nesse contexto, e notavel que para tornar a PG em algoritmo de excelência para OCC o primeiro passo e avaliar sua abordagem convencional para o problema, algo que ainda no foi realizado, e objetivo central do presente trabalho, pois a introdução de novas ideias somente se justica ao se conhecer as limitações e os resultados obtidos pelo algoritmo convencional. Contudo, a aplicação de PG para OCC requer que o problema seja transformado em classicação binaria, cujas duas classes que compõem o conjunto de dados de treino são compostas por exemplos de perl normal e anormal. Porem, em diversos problemas de OCC e impraticavel obter exemplos anormais, por isto neste trabalho enfatiza-se a avaliacão de algoritmos para gerar exemplos anormais, algo que tambem ainda não foi realizado para PG. Entre os algoritmos de geração de anomalia estudados, selecionou-se o metodo pro- posto por Banhalmi et al. [6] que baseia-se em exemplos mais distantes da classe normal, o algoritmo baseado no conceito de hiperesfera proposto por Tax e Duin [38] e a tecnica RNS (Real-valued Negative Selection) inspirada em sistemas imunologicos proposta por Gonzales et al. [19] [20]. Um estudo comparativo entre eles foi realizado, para avaliar o desempenho de classicação obtido por um classicador induzido por PG convencio- nal sob uma abordagem de classicacão binaria. Vericou-se que o metodo proposto por Banhalmi et al. possibilitou a obtencão dos melhores resultados. O algoritmo de geracão de anomalias com melhor avaliacão foi empregado aos demais experimentos do presente trabalho, entre eles, um estudo comparativo entre a PG pro- posta no presente trabalho e as abordagens da literatura para OCC. Nesse experimento, vericou-se que a PG proposta neste trabalho obteve melhores resultados de classicacão em dois problemas OCC, em outros três obteve desempenho similar e em um deles foi in- ferior. Portanto, atesta-se a hipotese de que e possvel resolver OCC usando um algoritmo de PG convencional utilizando o algoritmo adequado para geracão de anomalias. O impacto de certos parâmetros da PG tambem foi avaliado. Entre eles o tamanho da populacão, que apresentou maior impacto no desempenho de classicacão em um problema OCC comparado a diferentes ajustes no tamanho da arvore e na taxa de mutacão. Alem disso, diferentes funcões de aptidão tambem foram experimentadas. Vericou-se que a funcão composta pela media das taxas individuais de acerto em cada classe apresentou melhor desempenho de classicacão OCC quando comparada ao uso da metrica AUC (Area Under the Receiver Operation Characteristic Curve). A taxa WMW (Wilcoxon- Mann-Whitney), considerada um estimador da AUC com custo computacional inferior, tambem foi aplicada como funcão de aptidão e apresentou resultado semelhante ao uso da AUC. 2012-01-18T08:00:01Z 2012-01-18T08:00:01Z 2012-01-18 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1884/26537 por info:eu-repo/semantics/openAccess application/pdf reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná instacron:UFPR
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Teses
Programação genética (Computação)
Algoritmos geneticos
Classificação (Computadores)
spellingShingle Teses
Programação genética (Computação)
Algoritmos geneticos
Classificação (Computadores)
Cabral, Rafael da Veiga
Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
description Resumo: A PG (Programação Genetica) e aplicada com sucesso em Classicação. Entretanto, a pesquisa voltada a aplicação de PG para OCC (One-Class Classication) encontra-se em estagios iniciais, pois os poucos trabalhos relacionados existentes estão repletos de mudancas que não foram individualmente avaliadas e cujos propositos estão em resolver problemas provenientes do metodo de geracão de anomalias empregado e tambem na redução do tempo computacional da etapa de treino. Nesse contexto, e notavel que para tornar a PG em algoritmo de excelência para OCC o primeiro passo e avaliar sua abordagem convencional para o problema, algo que ainda no foi realizado, e objetivo central do presente trabalho, pois a introdução de novas ideias somente se justica ao se conhecer as limitações e os resultados obtidos pelo algoritmo convencional. Contudo, a aplicação de PG para OCC requer que o problema seja transformado em classicação binaria, cujas duas classes que compõem o conjunto de dados de treino são compostas por exemplos de perl normal e anormal. Porem, em diversos problemas de OCC e impraticavel obter exemplos anormais, por isto neste trabalho enfatiza-se a avaliacão de algoritmos para gerar exemplos anormais, algo que tambem ainda não foi realizado para PG. Entre os algoritmos de geração de anomalia estudados, selecionou-se o metodo pro- posto por Banhalmi et al. [6] que baseia-se em exemplos mais distantes da classe normal, o algoritmo baseado no conceito de hiperesfera proposto por Tax e Duin [38] e a tecnica RNS (Real-valued Negative Selection) inspirada em sistemas imunologicos proposta por Gonzales et al. [19] [20]. Um estudo comparativo entre eles foi realizado, para avaliar o desempenho de classicação obtido por um classicador induzido por PG convencio- nal sob uma abordagem de classicacão binaria. Vericou-se que o metodo proposto por Banhalmi et al. possibilitou a obtencão dos melhores resultados. O algoritmo de geracão de anomalias com melhor avaliacão foi empregado aos demais experimentos do presente trabalho, entre eles, um estudo comparativo entre a PG pro- posta no presente trabalho e as abordagens da literatura para OCC. Nesse experimento, vericou-se que a PG proposta neste trabalho obteve melhores resultados de classicacão em dois problemas OCC, em outros três obteve desempenho similar e em um deles foi in- ferior. Portanto, atesta-se a hipotese de que e possvel resolver OCC usando um algoritmo de PG convencional utilizando o algoritmo adequado para geracão de anomalias. O impacto de certos parâmetros da PG tambem foi avaliado. Entre eles o tamanho da populacão, que apresentou maior impacto no desempenho de classicacão em um problema OCC comparado a diferentes ajustes no tamanho da arvore e na taxa de mutacão. Alem disso, diferentes funcões de aptidão tambem foram experimentadas. Vericou-se que a funcão composta pela media das taxas individuais de acerto em cada classe apresentou melhor desempenho de classicacão OCC quando comparada ao uso da metrica AUC (Area Under the Receiver Operation Characteristic Curve). A taxa WMW (Wilcoxon- Mann-Whitney), considerada um estimador da AUC com custo computacional inferior, tambem foi aplicada como funcão de aptidão e apresentou resultado semelhante ao uso da AUC.
author2 Spinosa, Eduardo Jaques
author_facet Spinosa, Eduardo Jaques
Cabral, Rafael da Veiga
author Cabral, Rafael da Veiga
author_sort Cabral, Rafael da Veiga
title Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_short Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_full Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_fullStr Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_full_unstemmed Programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
title_sort programação genética baseada em árvores para classificação com uma classe com ênfase na geração de anomalias
publishDate 2012
url http://hdl.handle.net/1884/26537
work_keys_str_mv AT cabralrafaeldaveiga programacaogeneticabaseadaemarvoresparaclassificacaocomumaclassecomenfasenageracaodeanomalias
_version_ 1718647004617244672