Sparse Spatial Coding: a novel approach for efficient and accurate object recognition
=== Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse sp...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | English |
Published: |
Universidade Federal de Minas Gerais
2012
|
Online Access: | http://hdl.handle.net/1843/ESBF-8SVMLB |
id |
ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-ESBF-8SVMLB |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-ESBF-8SVMLB2019-01-21T17:52:23Z Sparse Spatial Coding: a novel approach for efficient and accurate object recognition Gabriel Leivas Oliveira Mario Fernando Montenegro Campos Gisele Lobo Pappa William Robson Schwartz Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse space, has raised the bar on sev-eral object recognition benchmarks. However, one serious drawback of sparse space based methods is that similar local features can be quantized into different visual words. We present in this thesis a new object recognition approach, called Sparse Spa-tial Coding (SSC), which combines a sparse coding dictionary learning and a spatial constraint coding stage. Thus, we minimize the problems of pure sparse represen-tations. Experimental evaluation was done at Caltech 101, Caltech 256, Corel 5000 and Corel 10000, that are datasets specifically designed to object recognition evalu-ation. The obtained results show that, to the best of our knowledge, our approach achieves accuracy beyond the best single feature method previously published on the databases. The method also outperformed, for the same bases, several methods that use multiple feature, and provide equivalent to or slightly lower results than other techniques. Finally, we verify our method generalization, applying the SSC to recognize scene in the Indoor 67 scene dataset, VPC and COLD, displaying perfor-mance comparable to state-of-the-art approaches in the first two bases and superior in COLD dataset. Até recentemente o reconhecimento de objetos, um problema clássicodaVisãoCom-putacional, vinha sendo abordado por técnicas baseadas em quantização vetorial. Entretanto, atualmente, abordagens que utilizam representação esparsa tem ap-resentado resultados significativamente superiores às técnicas usuais. Entretanto, uma desvantagem de métodos baseados em representação esparsa é o fato de car-acterísticas similares poderem ser quantizadas por conjuntos diferentes de palavras visuais. Esta dissertação apresenta um novo método de reconhecimento de objetos de-nominado SSC Sparse Spatial Coding o qual é caracterizado pelo aprendizado do dicionário utilizando representação esparsa e codificação baseada em restrição es-pacial. Dessa forma, minimiza-se significativamente o problema típico encontrado em representações estritamente esparsas. A avaliação do SSC foi realizada por meio de experimentos aplicando-o às bases Caltech 101, Caltech 256, Corel 5000 e Corel 10000, criadas especificamente para avaliação de técnicas de reconhecimento de objetos. Os resultados obtidos demonstram desempenho superior aos reportados na literatura até o momento para os métodos que utilizam um único descritor. O método também superou, para as mesmas bases, vários outros métodos que utilizam múltiplas características, e apre-sentou desempenho equivalente ou apenas ligeiramente inferior a outras técnicas. Finalmente, para verificarmos a generalização, o SSC foi utilizado para o reconheci-mento de cenas nas bases Indoor 67, VPC e COLD tendo apresentado desempenho comparável ao de abordagens do estado da arte para as duas primeiras bases e su-perior na base COLD. 2012-03-20 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1843/ESBF-8SVMLB eng info:eu-repo/semantics/openAccess text/html Universidade Federal de Minas Gerais 32001010004P6 - CIÊNCIA DA COMPUTAÇÃO UFMG BR reponame:Biblioteca Digital de Teses e Dissertações da UFMG instname:Universidade Federal de Minas Gerais instacron:UFMG |
collection |
NDLTD |
language |
English |
format |
Others
|
sources |
NDLTD |
description |
=== Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse space, has raised the bar on sev-eral object recognition benchmarks. However, one serious drawback of sparse space based methods is that similar local features can be quantized into different visual words. We present in this thesis a new object recognition approach, called Sparse Spa-tial Coding (SSC), which combines a sparse coding dictionary learning and a spatial constraint coding stage. Thus, we minimize the problems of pure sparse represen-tations. Experimental evaluation was done at Caltech 101, Caltech 256, Corel 5000 and Corel 10000, that are datasets specifically designed to object recognition evalu-ation. The obtained results show that, to the best of our knowledge, our approach achieves accuracy beyond the best single feature method previously published on the databases. The method also outperformed, for the same bases, several methods that use multiple feature, and provide equivalent to or slightly lower results than other techniques. Finally, we verify our method generalization, applying the SSC to recognize scene in the Indoor 67 scene dataset, VPC and COLD, displaying perfor-mance comparable to state-of-the-art approaches in the first two bases and superior in COLD dataset. === Até recentemente o reconhecimento de objetos, um problema clássicodaVisãoCom-putacional, vinha sendo abordado por técnicas baseadas em quantização vetorial. Entretanto, atualmente, abordagens que utilizam representação esparsa tem ap-resentado resultados significativamente superiores às técnicas usuais. Entretanto, uma desvantagem de métodos baseados em representação esparsa é o fato de car-acterísticas similares poderem ser quantizadas por conjuntos diferentes de palavras visuais. Esta dissertação apresenta um novo método de reconhecimento de objetos de-nominado SSC Sparse Spatial Coding o qual é caracterizado pelo aprendizado do dicionário utilizando representação esparsa e codificação baseada em restrição es-pacial. Dessa forma, minimiza-se significativamente o problema típico encontrado em representações estritamente esparsas. A avaliação do SSC foi realizada por meio de experimentos aplicando-o às bases Caltech 101, Caltech 256, Corel 5000 e Corel 10000, criadas especificamente para avaliação de técnicas de reconhecimento de objetos. Os resultados obtidos demonstram desempenho superior aos reportados na literatura até o momento para os métodos que utilizam um único descritor. O método também superou, para as mesmas bases, vários outros métodos que utilizam múltiplas características, e apre-sentou desempenho equivalente ou apenas ligeiramente inferior a outras técnicas. Finalmente, para verificarmos a generalização, o SSC foi utilizado para o reconheci-mento de cenas nas bases Indoor 67, VPC e COLD tendo apresentado desempenho comparável ao de abordagens do estado da arte para as duas primeiras bases e su-perior na base COLD. |
author2 |
Mario Fernando Montenegro Campos |
author_facet |
Mario Fernando Montenegro Campos Gabriel Leivas Oliveira |
author |
Gabriel Leivas Oliveira |
spellingShingle |
Gabriel Leivas Oliveira Sparse Spatial Coding: a novel approach for efficient and accurate object recognition |
author_sort |
Gabriel Leivas Oliveira |
title |
Sparse Spatial Coding: a novel approach for efficient and accurate object recognition |
title_short |
Sparse Spatial Coding: a novel approach for efficient and accurate object recognition |
title_full |
Sparse Spatial Coding: a novel approach for efficient and accurate object recognition |
title_fullStr |
Sparse Spatial Coding: a novel approach for efficient and accurate object recognition |
title_full_unstemmed |
Sparse Spatial Coding: a novel approach for efficient and accurate object recognition |
title_sort |
sparse spatial coding: a novel approach for efficient and accurate object recognition |
publisher |
Universidade Federal de Minas Gerais |
publishDate |
2012 |
url |
http://hdl.handle.net/1843/ESBF-8SVMLB |
work_keys_str_mv |
AT gabrielleivasoliveira sparsespatialcodinganovelapproachforefficientandaccurateobjectrecognition |
_version_ |
1718843508157054976 |