Summary: | Made available in DSpace on 2014-06-12T15:56:06Z (GMT). No. of bitstreams: 2
arquivo2738_1.pdf: 2219821 bytes, checksum: e0060e817bd6a925ad67e0971641acff (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2011 === Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === Classificadores têm sido largamente aplicados nos mais diversos campos científicos e industriais, em geral obtendo bons desempenhos. Entretanto, quando aplicados a problemas cuja quantidade de dados disponível para o treinamento é limitada (bases de dados pequenas) ou quando estes dados apresentam um desbalanceamento entre as classes (bases de dados desbalanceadas), a maioria dos classificadores obtém um desempenho pobre. O poder de generalização do classificador é reduzido quando bases de dados pequenas são utilizadas durante o processo de treinamento, enquanto que em bases de dados desbalanceadas, as classes com maior representatividade e menor importância tendem a ser favorecidas. Inerentes a diversos problemas do mundo real, conjuntos de dados pequenos e desbalanceados representam uma limitação a ser superada por algoritmos de aprendizagem para produção de classificadores precisos e confiáveis. Neste trabalho é proposta uma abordagem baseada na adição de ruído Gaussiano durante o processo de treinamento de uma rede neural MultiLayer Perceptron (MLP) com o intuito de contornar as limitações referentes às bases de dados pequenas e/ou desbalanceadas, possibilitando a rede neural obter um alto poder de generalização A metodologia proposta pode ser dividida em duas etapas principais. Na primeira, um estudo acerca da correlação entre as variáveis é realizado. Este estudo envolve avaliar a correlação entre as variáveis por meio do coeficiente de correlação de Pearson e a descorrelação das variáveis através do método Análise de Componentes Principais (ACP). Na segunda, ruídos derivados a partir de uma distribuição Gaussiana são inseridos nas variáveis de entrada. Para validar a abordagem proposta foram utilizadas três bases públicas de um conhecido benchmark da comunidade de redes neurais, Proben1. Os resultados experimentais indicam que a abordagem proposta obtém um desempenho estatisticamente melhor (95% de confiança) que o método de treinamento convencional, principalmente quando utilizado o método PCA para descorrelação das variáveis antes da aplicação de ruído
|