Um classificador baseado em perturbações

Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:44:41Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) === Approved for entr...

Full description

Bibliographic Details
Main Author: ARAÚJO, Edson Leite
Other Authors: http://lattes.cnpq.br/8577312109146354
Language:Portuguese
Published: Universidade Federal de Pernambuco 2018
Subjects:
Online Access:https://repositorio.ufpe.br/handle/123456789/25856
id ndltd-IBICT-oai-repositorio.ufpe.br-123456789-25856
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Inteligência artificial
Reconhecimento de padrão
spellingShingle Inteligência artificial
Reconhecimento de padrão
ARAÚJO, Edson Leite
Um classificador baseado em perturbações
description Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:44:41Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) === Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-24T21:24:41Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) === Made available in DSpace on 2018-08-24T21:24:41Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) Previous issue date: 2017-04-10 === Muitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza fortemente dos vetores médios, μi, e matrizes de covariância, Σi, de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto, as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros μi e Σi sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros μi e Σi ou numa combinação de ambos. Nesta área, várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de vetores de suporte(SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente aos k-Nearest Neighboor com k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões. === Many pattern recognition algorithms are probabilistic in their structure and as such, they use statistical inference to determine the best label for a given instance to be classified. The statistical inference is based generally on Bayes theory which strongly uses the average vectors, μi, and covariance matrices, Σi, of existing classes in the training data. These parameters are unknown and estimates are made by following various algorithms. However, the estimates made exclusively from the training data are still the most used. Because they are estimates, the parameters μi and Σi are perturbed when a new vector is inserted into the class which they belong to. Evaluating the perturbations that occurred in all classes simulating a possible inclusion of the instance to be classified in the same one, we defined in this work a new decision rule which assigns the test instance to the class in which occurs the slightest perturbation μi and Σi parameters or the combination of both. In this area, several approaches are possible, it’s worth mentioning the decision trees, neural networks, instance-based learning and the support vector machine (SVM). However, until the moment of the writing of this text, was not found in the literature, approaches that use parameters perturbations to pattern’s classification. In tests performed initially on synthetic data and later on 21 real databases available in the UCI Repository Learning, was verified that perturbation-based classifier, which was denominated PerC (Perturbation Classifier), presented performance significantly superior to the versions of the SVM with polinomial kernels of degrees 2 and 3 and roughly equivalent to k-Nearest Neighboor with k = 3 and k = 5, Naïve Bayes, SVM with Gaussian kernel, CART and MLP neural networks, having the PerC the highest ranking according to the Friedman statistical test. The results demonstrated that the perturbation-based approach is therefore useful to pattern classification.
author2 http://lattes.cnpq.br/8577312109146354
author_facet http://lattes.cnpq.br/8577312109146354
ARAÚJO, Edson Leite
author ARAÚJO, Edson Leite
author_sort ARAÚJO, Edson Leite
title Um classificador baseado em perturbações
title_short Um classificador baseado em perturbações
title_full Um classificador baseado em perturbações
title_fullStr Um classificador baseado em perturbações
title_full_unstemmed Um classificador baseado em perturbações
title_sort um classificador baseado em perturbações
publisher Universidade Federal de Pernambuco
publishDate 2018
url https://repositorio.ufpe.br/handle/123456789/25856
work_keys_str_mv AT araujoedsonleite umclassificadorbaseadoemperturbacoes
_version_ 1718865528393564160
spelling ndltd-IBICT-oai-repositorio.ufpe.br-123456789-258562019-01-21T19:28:45Z Um classificador baseado em perturbações ARAÚJO, Edson Leite http://lattes.cnpq.br/8577312109146354 CAVALCANTI, George Darmiton da Cunha Inteligência artificial Reconhecimento de padrão Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:44:41Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-24T21:24:41Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) Made available in DSpace on 2018-08-24T21:24:41Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) Previous issue date: 2017-04-10 Muitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza fortemente dos vetores médios, μi, e matrizes de covariância, Σi, de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto, as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros μi e Σi sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros μi e Σi ou numa combinação de ambos. Nesta área, várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de vetores de suporte(SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente aos k-Nearest Neighboor com k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões. Many pattern recognition algorithms are probabilistic in their structure and as such, they use statistical inference to determine the best label for a given instance to be classified. The statistical inference is based generally on Bayes theory which strongly uses the average vectors, μi, and covariance matrices, Σi, of existing classes in the training data. These parameters are unknown and estimates are made by following various algorithms. However, the estimates made exclusively from the training data are still the most used. Because they are estimates, the parameters μi and Σi are perturbed when a new vector is inserted into the class which they belong to. Evaluating the perturbations that occurred in all classes simulating a possible inclusion of the instance to be classified in the same one, we defined in this work a new decision rule which assigns the test instance to the class in which occurs the slightest perturbation μi and Σi parameters or the combination of both. In this area, several approaches are possible, it’s worth mentioning the decision trees, neural networks, instance-based learning and the support vector machine (SVM). However, until the moment of the writing of this text, was not found in the literature, approaches that use parameters perturbations to pattern’s classification. In tests performed initially on synthetic data and later on 21 real databases available in the UCI Repository Learning, was verified that perturbation-based classifier, which was denominated PerC (Perturbation Classifier), presented performance significantly superior to the versions of the SVM with polinomial kernels of degrees 2 and 3 and roughly equivalent to k-Nearest Neighboor with k = 3 and k = 5, Naïve Bayes, SVM with Gaussian kernel, CART and MLP neural networks, having the PerC the highest ranking according to the Friedman statistical test. The results demonstrated that the perturbation-based approach is therefore useful to pattern classification. 2018-08-24T21:24:41Z 2018-08-24T21:24:41Z 2017-04-10 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis https://repositorio.ufpe.br/handle/123456789/25856 por http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco Programa de Pos Graduacao em Ciencia da Computacao UFPE Brasil reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE