Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos

Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:50:01Z No. of bitstreams: 2 Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) === Made available in DSpa...

Full description

Bibliographic Details
Main Author: Coelho, Gleydson Vilanova Viana
Other Authors: Cavalcanti, George Darmiton da Cunha
Language:br
Published: Universidade Federal de Pernambuco 2015
Subjects:
kNN
Online Access:https://repositorio.ufpe.br/handle/123456789/11965
id ndltd-IBICT-oai-repositorio.ufpe.br-123456789-11965
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufpe.br-123456789-119652019-01-21T19:16:05Z Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos Coelho, Gleydson Vilanova Viana Cavalcanti, George Darmiton da Cunha Diferenciação entre textos manuscritos e impressos Otimização Redução de dimensionalidade Seleção de características Algoritmos genéticos kNN Redes Neurais MLP Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:50:01Z No. of bitstreams: 2 Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Made available in DSpace on 2015-03-11T17:34:31Z (GMT). No. of bitstreams: 2 Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013 A presença de textos manuscritos e impressos em um mesmo documento representa um grande desafio para os atuais mecanismos de Reconhecimento Óptico de Caracteres. Uma vez que essas classes de texto possuem suas próprias rotinas de reconhecimento, o uso de técnicas que permitam diferenciação entre elas tornou-se indispensável e o bom funcionamento dessas técnicas depende da escolha de características que melhor representem os elementos de texto sobre os quais os classificadores devem atuar. Considerando que na literatura existe uma grande variedade de características utilizadas para este fim, este trabalho objetiva o desenvolvimento de um método que permita, através de um processo de otimização com Algoritmos Genéticos e a partir de um conjunto inicial de 52 características, a seleção de subconjuntos de melhores características que, além de menores que o conjunto original, possibilitem melhoria dos resultados de classificação. Os experimentos foram realizados com classificadores kNN e Redes Neurais MLP a partir de imagens de palavras segmentadas. O método proposto foi avaliado fazendo uso de uma base de dados pública para textos manuscritos e outra criada especificamente para este trabalho para textos impressos. Os resultados dos experimentos mostram que os objetivos propostos foram alcançados. Os Erros Médios de Classificação foram estatisticamente equivalentes para os dois classificadores e uma melhor performance foi obtida com o kNN. A influência dos diferentes tipos de fontes e estilos utilizados nos textos impressos também foi analisada e mostrou que as fontes que imitam textos manuscritos como a "Lucida Handwriting" e "Comic Sans MS" apresentam maiores ocorrências de erros de classificação. Da mesma forma, a maioria dos erros foi percebida nos textos impressos com estilo itálico. 2015-03-11T17:34:31Z 2015-03-11T17:34:31Z 2013-01-31 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis COÊLHO, Gleydson Vilanova Viana. Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos. Recife, 2013. 112 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2013. https://repositorio.ufpe.br/handle/123456789/11965 br Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE
collection NDLTD
language br
sources NDLTD
topic Diferenciação entre textos manuscritos e impressos
Otimização
Redução de dimensionalidade
Seleção de características
Algoritmos genéticos
kNN
Redes Neurais MLP
spellingShingle Diferenciação entre textos manuscritos e impressos
Otimização
Redução de dimensionalidade
Seleção de características
Algoritmos genéticos
kNN
Redes Neurais MLP
Coelho, Gleydson Vilanova Viana
Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
description Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-10T18:50:01Z No. of bitstreams: 2 Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) === Made available in DSpace on 2015-03-11T17:34:31Z (GMT). No. of bitstreams: 2 Dissertação Gleydson Vilanova.pdf: 10406213 bytes, checksum: 4161dab35fb90ca62e4ebd0186c0870e (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013 === A presença de textos manuscritos e impressos em um mesmo documento representa um grande desafio para os atuais mecanismos de Reconhecimento Óptico de Caracteres. Uma vez que essas classes de texto possuem suas próprias rotinas de reconhecimento, o uso de técnicas que permitam diferenciação entre elas tornou-se indispensável e o bom funcionamento dessas técnicas depende da escolha de características que melhor representem os elementos de texto sobre os quais os classificadores devem atuar. Considerando que na literatura existe uma grande variedade de características utilizadas para este fim, este trabalho objetiva o desenvolvimento de um método que permita, através de um processo de otimização com Algoritmos Genéticos e a partir de um conjunto inicial de 52 características, a seleção de subconjuntos de melhores características que, além de menores que o conjunto original, possibilitem melhoria dos resultados de classificação. Os experimentos foram realizados com classificadores kNN e Redes Neurais MLP a partir de imagens de palavras segmentadas. O método proposto foi avaliado fazendo uso de uma base de dados pública para textos manuscritos e outra criada especificamente para este trabalho para textos impressos. Os resultados dos experimentos mostram que os objetivos propostos foram alcançados. Os Erros Médios de Classificação foram estatisticamente equivalentes para os dois classificadores e uma melhor performance foi obtida com o kNN. A influência dos diferentes tipos de fontes e estilos utilizados nos textos impressos também foi analisada e mostrou que as fontes que imitam textos manuscritos como a "Lucida Handwriting" e "Comic Sans MS" apresentam maiores ocorrências de erros de classificação. Da mesma forma, a maioria dos erros foi percebida nos textos impressos com estilo itálico.
author2 Cavalcanti, George Darmiton da Cunha
author_facet Cavalcanti, George Darmiton da Cunha
Coelho, Gleydson Vilanova Viana
author Coelho, Gleydson Vilanova Viana
author_sort Coelho, Gleydson Vilanova Viana
title Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
title_short Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
title_full Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
title_fullStr Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
title_full_unstemmed Seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
title_sort seleção de características usando algoritmos genéticos para classificação de imagens de textos em manuscritos e impressos
publisher Universidade Federal de Pernambuco
publishDate 2015
url https://repositorio.ufpe.br/handle/123456789/11965
work_keys_str_mv AT coelhogleydsonvilanovaviana selecaodecaracteristicasusandoalgoritmosgeneticosparaclassificacaodeimagensdetextosemmanuscritoseimpressos
_version_ 1718863243812798464