Sparse Spatial Coding: a novel approach for efficient and accurate object recognition

=== Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse sp...

Full description

Bibliographic Details
Main Author: Gabriel Leivas Oliveira
Other Authors: Mario Fernando Montenegro Campos
Format: Others
Language:English
Published: Universidade Federal de Minas Gerais 2012
Online Access:http://hdl.handle.net/1843/ESBF-8SVMLB
id ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-ESBF-8SVMLB
record_format oai_dc
spelling ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-ESBF-8SVMLB2019-01-21T17:52:23Z Sparse Spatial Coding: a novel approach for efficient and accurate object recognition Gabriel Leivas Oliveira Mario Fernando Montenegro Campos Gisele Lobo Pappa William Robson Schwartz Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse space, has raised the bar on sev-eral object recognition benchmarks. However, one serious drawback of sparse space based methods is that similar local features can be quantized into different visual words. We present in this thesis a new object recognition approach, called Sparse Spa-tial Coding (SSC), which combines a sparse coding dictionary learning and a spatial constraint coding stage. Thus, we minimize the problems of pure sparse represen-tations. Experimental evaluation was done at Caltech 101, Caltech 256, Corel 5000 and Corel 10000, that are datasets specifically designed to object recognition evalu-ation. The obtained results show that, to the best of our knowledge, our approach achieves accuracy beyond the best single feature method previously published on the databases. The method also outperformed, for the same bases, several methods that use multiple feature, and provide equivalent to or slightly lower results than other techniques. Finally, we verify our method generalization, applying the SSC to recognize scene in the Indoor 67 scene dataset, VPC and COLD, displaying perfor-mance comparable to state-of-the-art approaches in the first two bases and superior in COLD dataset. Até recentemente o reconhecimento de objetos, um problema clássicodaVisãoCom-putacional, vinha sendo abordado por técnicas baseadas em quantização vetorial. Entretanto, atualmente, abordagens que utilizam representação esparsa tem ap-resentado resultados significativamente superiores às técnicas usuais. Entretanto, uma desvantagem de métodos baseados em representação esparsa é o fato de car-acterísticas similares poderem ser quantizadas por conjuntos diferentes de palavras visuais. Esta dissertação apresenta um novo método de reconhecimento de objetos de-nominado SSC Sparse Spatial Coding o qual é caracterizado pelo aprendizado do dicionário utilizando representação esparsa e codificação baseada em restrição es-pacial. Dessa forma, minimiza-se significativamente o problema típico encontrado em representações estritamente esparsas. A avaliação do SSC foi realizada por meio de experimentos aplicando-o às bases Caltech 101, Caltech 256, Corel 5000 e Corel 10000, criadas especificamente para avaliação de técnicas de reconhecimento de objetos. Os resultados obtidos demonstram desempenho superior aos reportados na literatura até o momento para os métodos que utilizam um único descritor. O método também superou, para as mesmas bases, vários outros métodos que utilizam múltiplas características, e apre-sentou desempenho equivalente ou apenas ligeiramente inferior a outras técnicas. Finalmente, para verificarmos a generalização, o SSC foi utilizado para o reconheci-mento de cenas nas bases Indoor 67, VPC e COLD tendo apresentado desempenho comparável ao de abordagens do estado da arte para as duas primeiras bases e su-perior na base COLD. 2012-03-20 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1843/ESBF-8SVMLB eng info:eu-repo/semantics/openAccess text/html Universidade Federal de Minas Gerais 32001010004P6 - CIÊNCIA DA COMPUTAÇÃO UFMG BR reponame:Biblioteca Digital de Teses e Dissertações da UFMG instname:Universidade Federal de Minas Gerais instacron:UFMG
collection NDLTD
language English
format Others
sources NDLTD
description === Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse space, has raised the bar on sev-eral object recognition benchmarks. However, one serious drawback of sparse space based methods is that similar local features can be quantized into different visual words. We present in this thesis a new object recognition approach, called Sparse Spa-tial Coding (SSC), which combines a sparse coding dictionary learning and a spatial constraint coding stage. Thus, we minimize the problems of pure sparse represen-tations. Experimental evaluation was done at Caltech 101, Caltech 256, Corel 5000 and Corel 10000, that are datasets specifically designed to object recognition evalu-ation. The obtained results show that, to the best of our knowledge, our approach achieves accuracy beyond the best single feature method previously published on the databases. The method also outperformed, for the same bases, several methods that use multiple feature, and provide equivalent to or slightly lower results than other techniques. Finally, we verify our method generalization, applying the SSC to recognize scene in the Indoor 67 scene dataset, VPC and COLD, displaying perfor-mance comparable to state-of-the-art approaches in the first two bases and superior in COLD dataset. === Até recentemente o reconhecimento de objetos, um problema clássicodaVisãoCom-putacional, vinha sendo abordado por técnicas baseadas em quantização vetorial. Entretanto, atualmente, abordagens que utilizam representação esparsa tem ap-resentado resultados significativamente superiores às técnicas usuais. Entretanto, uma desvantagem de métodos baseados em representação esparsa é o fato de car-acterísticas similares poderem ser quantizadas por conjuntos diferentes de palavras visuais. Esta dissertação apresenta um novo método de reconhecimento de objetos de-nominado SSC Sparse Spatial Coding o qual é caracterizado pelo aprendizado do dicionário utilizando representação esparsa e codificação baseada em restrição es-pacial. Dessa forma, minimiza-se significativamente o problema típico encontrado em representações estritamente esparsas. A avaliação do SSC foi realizada por meio de experimentos aplicando-o às bases Caltech 101, Caltech 256, Corel 5000 e Corel 10000, criadas especificamente para avaliação de técnicas de reconhecimento de objetos. Os resultados obtidos demonstram desempenho superior aos reportados na literatura até o momento para os métodos que utilizam um único descritor. O método também superou, para as mesmas bases, vários outros métodos que utilizam múltiplas características, e apre-sentou desempenho equivalente ou apenas ligeiramente inferior a outras técnicas. Finalmente, para verificarmos a generalização, o SSC foi utilizado para o reconheci-mento de cenas nas bases Indoor 67, VPC e COLD tendo apresentado desempenho comparável ao de abordagens do estado da arte para as duas primeiras bases e su-perior na base COLD.
author2 Mario Fernando Montenegro Campos
author_facet Mario Fernando Montenegro Campos
Gabriel Leivas Oliveira
author Gabriel Leivas Oliveira
spellingShingle Gabriel Leivas Oliveira
Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
author_sort Gabriel Leivas Oliveira
title Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
title_short Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
title_full Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
title_fullStr Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
title_full_unstemmed Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
title_sort sparse spatial coding: a novel approach for efficient and accurate object recognition
publisher Universidade Federal de Minas Gerais
publishDate 2012
url http://hdl.handle.net/1843/ESBF-8SVMLB
work_keys_str_mv AT gabrielleivasoliveira sparsespatialcodinganovelapproachforefficientandaccurateobjectrecognition
_version_ 1718843508157054976