Sistema adaptativo neural para compressão sequencial e classificação de textos

Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Produção, Florianópolis, 2001. === Made available in DSpace on 2012-10-19T11:16:50Z (GMT). No. of bitstreams: 1 275689.pdf: 1228085 bytes, checksum: 7d3ac0ba5215b376d944863...

Full description

Bibliographic Details
Main Author: Ricken, Cristina Elisabeth
Other Authors: Universidade Federal de Santa Catarina
Format: Others
Language:Portuguese
Published: 2012
Subjects:
Online Access:http://repositorio.ufsc.br/xmlui/handle/123456789/82079
id ndltd-IBICT-oai-repositorio.ufsc.br-123456789-82079
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufsc.br-123456789-820792019-01-21T15:59:34Z Sistema adaptativo neural para compressão sequencial e classificação de textos Ricken, Cristina Elisabeth Universidade Federal de Santa Catarina Wazlawick, Raul Sidnei Engenharia de produção Redes neurais (Computação) Teoria da informação Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Produção, Florianópolis, 2001. Made available in DSpace on 2012-10-19T11:16:50Z (GMT). No. of bitstreams: 1 275689.pdf: 1228085 bytes, checksum: 7d3ac0ba5215b376d94486385f897bb2 (MD5) O contexto de crescente disponibilidade de informação textual em formato digital evidencia a importância de mecanismos de compactação de dados sem perda e de classificação automática de textos para a gestão de informações. Esta dissertação apresenta um novo sistema para compressão de dados sem perda, utilizando uma rede neural artificial baseada na Teoria da Ressonância Adaptativa (Adaptive Resonance Theory - ART) para modelagem preditiva de seqüências discretas. Uma rede fuzzy ARTMAP modificada gera modelos para estimações probabilísticas e é integrada a um codificador aritmético. O sistema adaptativo neural de compressão desenvolvido realiza o aprendizado incremental dos padrões observados nas seqüências apresentadas, executando a compactação seqüencial e a descompactação exata de seqüências discretas sem conhecimento prévio da estrutura estatística da fonte das mensagens. O sistema foi testado diante de uma base de dados pública para benchmark (formada por arquivos binários e de texto) para avaliação de seu desempenho em relação a compactadores de texto tradicionais, atingindo taxas de compressão melhores que o software gzip. Além da viabilidade de utilização da rede neural proposta no estágio de modelagem do processo de compressão sem perda, a capacidade do sistema desenvolvido foi testada em duas tarefas de classificação automática de textos: identificação de idiomas e classificação por gênero de textos. A classificação por gênero de textos, por meio da abordagem do presente trabalho, visa designar textos a classes de publicações digitais, conforme a similaridade em relação ao modelo que representa cada classe. A técnica neural de compressão foi aplicada a estas tarefas, medindo a entropia cruzada entre cada exemplar de teste e um modelo gerado. A similaridade entre uma seqüência de texto e cada uma das classes é determinada autonomamente pelo sistema, sem a pré-definição de atributos ou conhecimento analítico sobre o texto ou um idioma específico. Na tarefa de identificação de idiomas todos os itens de teste foram perfeitamente reconhecidos e na tarefa de classificação por gênero de textos o sistema classificou corretamente 95,83% dos exemplares de teste apresentados. A compressão sem perda de seqüências discretas propicia um ambiente para estudo do comportamento da rede neural proposta em tarefas que requerem adaptação e estimação probabilística on-line. Além da compressão de dados sem perda, o sistema neural desenvolvido pode ser aplicado a outras áreas que requerem aprendizado de padrões, modelagem preditiva e classificação de seqüências, como descoberta de conhecimento em bases de dados para gestão de informações e inteligência de negócios. 2012-10-19T11:16:50Z 2012-10-19T11:16:50Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://repositorio.ufsc.br/xmlui/handle/123456789/82079 275689 por info:eu-repo/semantics/openAccess 251 f.| il., grafs., tabs. reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina instacron:UFSC
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Engenharia de produção
Redes neurais (Computação)
Teoria da informação
spellingShingle Engenharia de produção
Redes neurais (Computação)
Teoria da informação
Ricken, Cristina Elisabeth
Sistema adaptativo neural para compressão sequencial e classificação de textos
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Produção, Florianópolis, 2001. === Made available in DSpace on 2012-10-19T11:16:50Z (GMT). No. of bitstreams: 1 275689.pdf: 1228085 bytes, checksum: 7d3ac0ba5215b376d94486385f897bb2 (MD5) === O contexto de crescente disponibilidade de informação textual em formato digital evidencia a importância de mecanismos de compactação de dados sem perda e de classificação automática de textos para a gestão de informações. Esta dissertação apresenta um novo sistema para compressão de dados sem perda, utilizando uma rede neural artificial baseada na Teoria da Ressonância Adaptativa (Adaptive Resonance Theory - ART) para modelagem preditiva de seqüências discretas. Uma rede fuzzy ARTMAP modificada gera modelos para estimações probabilísticas e é integrada a um codificador aritmético. O sistema adaptativo neural de compressão desenvolvido realiza o aprendizado incremental dos padrões observados nas seqüências apresentadas, executando a compactação seqüencial e a descompactação exata de seqüências discretas sem conhecimento prévio da estrutura estatística da fonte das mensagens. O sistema foi testado diante de uma base de dados pública para benchmark (formada por arquivos binários e de texto) para avaliação de seu desempenho em relação a compactadores de texto tradicionais, atingindo taxas de compressão melhores que o software gzip. Além da viabilidade de utilização da rede neural proposta no estágio de modelagem do processo de compressão sem perda, a capacidade do sistema desenvolvido foi testada em duas tarefas de classificação automática de textos: identificação de idiomas e classificação por gênero de textos. A classificação por gênero de textos, por meio da abordagem do presente trabalho, visa designar textos a classes de publicações digitais, conforme a similaridade em relação ao modelo que representa cada classe. A técnica neural de compressão foi aplicada a estas tarefas, medindo a entropia cruzada entre cada exemplar de teste e um modelo gerado. A similaridade entre uma seqüência de texto e cada uma das classes é determinada autonomamente pelo sistema, sem a pré-definição de atributos ou conhecimento analítico sobre o texto ou um idioma específico. Na tarefa de identificação de idiomas todos os itens de teste foram perfeitamente reconhecidos e na tarefa de classificação por gênero de textos o sistema classificou corretamente 95,83% dos exemplares de teste apresentados. A compressão sem perda de seqüências discretas propicia um ambiente para estudo do comportamento da rede neural proposta em tarefas que requerem adaptação e estimação probabilística on-line. Além da compressão de dados sem perda, o sistema neural desenvolvido pode ser aplicado a outras áreas que requerem aprendizado de padrões, modelagem preditiva e classificação de seqüências, como descoberta de conhecimento em bases de dados para gestão de informações e inteligência de negócios.
author2 Universidade Federal de Santa Catarina
author_facet Universidade Federal de Santa Catarina
Ricken, Cristina Elisabeth
author Ricken, Cristina Elisabeth
author_sort Ricken, Cristina Elisabeth
title Sistema adaptativo neural para compressão sequencial e classificação de textos
title_short Sistema adaptativo neural para compressão sequencial e classificação de textos
title_full Sistema adaptativo neural para compressão sequencial e classificação de textos
title_fullStr Sistema adaptativo neural para compressão sequencial e classificação de textos
title_full_unstemmed Sistema adaptativo neural para compressão sequencial e classificação de textos
title_sort sistema adaptativo neural para compressão sequencial e classificação de textos
publishDate 2012
url http://repositorio.ufsc.br/xmlui/handle/123456789/82079
work_keys_str_mv AT rickencristinaelisabeth sistemaadaptativoneuralparacompressaosequencialeclassificacaodetextos
_version_ 1718817067658903552