Avaliação do detector de pontos de interesse IGFTT em visual SLAM

Orientador : Prof. Dr. Eduardo Todt === Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 30/08/2017 === Inclui referências : f. 115-124 === Resumo: Detectores de Ponto de Interesse (POI) são partes fundamen...

Full description

Bibliographic Details
Main Author: Zacarkim, Valber Lemes
Other Authors: Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
Format: Others
Language:Portuguese
Published: 2017
Subjects:
Online Access:http://hdl.handle.net/1884/50269
Description
Summary:Orientador : Prof. Dr. Eduardo Todt === Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 30/08/2017 === Inclui referências : f. 115-124 === Resumo: Detectores de Ponto de Interesse (POI) são partes fundamentais de um Sistema Visual de Mapeamento e Localização Simultâneos (VSLAM). Pontos de interesse na imagem são usados pela odometria visual para estimar o deslocamento de um robô por meio do movimento de câmera. Além disso, o robô pode reconhecer lugares já visitados pela correspondência de pontos de interesse entre imagens. Avaliar a qualidade destes detectores no sentido de determinar qual o melhor para ser utilizado em determinado ambiente, é de extrema importância ao VSLAM, pois a qualidade do mapa gerado pelo sistema depende de robustos pontos de interesse encontrados nas imagens. Um novo detector de pontos de interesse conhecido como IGFTT apresenta resultados promissores em relação aos métodos clássicos como SURF, SIFT, ORB e outros. O presente trabalho avalia o novo algoritmo de detecção de pontos de interesse IGFTT em função do desempenho de um sistema Visual SLAM, comparando-o com os detectores mais populares na comunidade acadêmica como o SIFT, SURF, FAST, AGAST, GFTT, entre outros. É utilizada uma base pública como benchmark em conjunto com um sistema de VSLAM de código aberto. A qualidade do detector é determinada em função do mapa gerado pelo VSLAM, do tempo de processamento, da taxa de repetibilidade dos pontos de interesse, da probabilidade de sobrevivência destes em frames futuros e da quantidade de nós sucessivos no grafo de cena. Os testes demonstram as qualidades e as deficiências do algoritmo IGFTT. Os resultados de cada detector para cada teste são ranqueados de forma global e demonstram a acurácia geral dos algoritmos. No ranking obtido, SURF apresenta-se em primeiro lugar, em segundo lugar o IGFTT2, melhoria do algoritmo testado, e em terceiro o IGFTT. A acurácia do detector é definida pelo Erro da Trajetória Absoluta e apresenta o algoritmo GFTT com 0,278 metros de erro obtendo o melhor resultado e IGFTT, o pior resultado com 0,944 metros de erro, e o algoritmo IGFTT2 obteve um erro de 0,712 metros. Em tempo de processamento por frame nas fases de detecção, descrição e correspondência dos pontos de interesse, IGFTT obteve o melhor desempenho consumindo em média 52,1 milissegundos, demonstrando ser extremamente rápido. IGFTT alcançou a segunda melhor colocação em relação a taxa de repetibilidade e probabilidade dos POIs, atrás do SURF. E quanto à taxa de nós do grafo de cena em sequência, IGFTT obteve o melhor resultado com 47,07%. SURF conseguiu uma taxa de 39,30% porém destes, somente 1,33% não tiveram poses atribuídas pelo sistema RGBDSLAM. De forma geral, o detector de pontos de interesse IGFTT é veloz em termos de tempo de processamento e estável, dada dispersão dos seus resultados conforme variedade de sequências sob testes. Palavras-chave: Detectores de Pontos de Interesse, Odometria Visual, Visual SLAM, Avaliação de Detectores de Pontos de Interesse. === Abstract: Keypoints Detectors are fundamental parts of a Visual Simultaneous Localization and Mapping System or VSLAM. Keypoints in the image are used by visual odometry to estimate the displacement of a robot by means of camera movement. Furthermore, the robot can recognize places already visited by matching keypoints between images. To evaluate the quality of these detectors in order to determine the best to be used in a particular environment, it is of extreme importance to SLAM, since the quality of the map generated by the system depends on robust keypoints found in the images. The present work evaluates the new algorithm of keypoints detection IGFTT as a function of the performance of a Visual SLAM system, comparing it with the most popular detectors in the academic community such as SIFT, SURF, FAST, AGAST, GFTT, among others. A public database is used as a benchmark in conjunction with an open source VSLAM system. The quality of the detector is determined by the VSLAM generated map, runtime processing, keypoints repeatability rate, they survival probability rate in future frames and the number of successive nodes in the scene graph. The tests demonstrate the qualities and shortcomings of the IGFTT algorithm. The results of each detector for each test are globally ranked and demonstrate the overall accuracy of the algorithms. In the obtained ranking, SURF presents first, secondly the IGFTT2, improvement of the algorithm tested, and thirdly the IGFTT. The accuracy of the detector is defined by the Absolute Trajectory Error and presents the GFTT algorithm with 0.278 meters of error obtaining the best result and IGFTT, the worst result with 0.944 meters of error, and IGFTT2 algorithm obtained an error of 0.712 meters. In runtime processing per frame in the phases of detection, description and correspondence of keypoints, IGFTT obtained the best performance consuming in average 52.1 milliseconds, proving to be extremely fast. IGFTT achieved the second best placement in relation to the repeatability and probability rate of POIs, behind SURF. As for the node rate of the scene graph in sequence, IGFTT obtained the best result with 47.07%. SURF achieved a rate of 39.30% but of these, only 1.33% had no poses attributed by the system RGBDSLAM. In general, the IGFTT keypoint detector is fast in terms of time processing and stable, given its dispersion of results according to the variety of sequences under test. Keywords: Keypoints Detectors, Visual Odometry, Visual SLAM, Keypoints Detectors Evaluation.