Recuperação de imagens por conteúdo baseada em realimentação de relevância e classificador por floresta de caminhos ótimos
Orientadores: Léo Pini Magalhães, Alexandre Xavier Falcão === Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação === Made available in DSpace on 2018-08-18T18:42:18Z (GMT). No. of bitstreams: 1 Silva_AndreTavaresda_D.pdf: 6866624 bytes, checksum: 1...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
[s.n.]
2011
|
Subjects: | |
Online Access: | SILVA, André Tavares da. Recuperação de imagens por conteúdo baseada em realimentação de relevância e classificador por floresta de caminhos ótimos. 2011. 150 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/260942>. Acesso em: 18 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/260942 |
Summary: | Orientadores: Léo Pini Magalhães, Alexandre Xavier Falcão === Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação === Made available in DSpace on 2018-08-18T18:42:18Z (GMT). No. of bitstreams: 1
Silva_AndreTavaresda_D.pdf: 6866624 bytes, checksum: 179040a4095c5042ee1d1b5b5f11ebfb (MD5)
Previous issue date: 2011 === Resumo: Com o crescente aumento de coleções de imagens resultantes da popularização da Internet e das câmeras digitais, métodos eficientes de busca tornam-se cada vez mais necessários. Neste contexto, esta tese propõe novos métodos de recuperação de imagens por conteúdo baseados em realimentação de relevância e no classificador por floresta de caminhos ótimos (OPF - Optimum-Path Forest), sendo também a primeira vez que o classificador OPF é utilizado em conjuntos de treinamento pequenos. Esta tese denomina como guloso e planejado os dois paradigmas distintos de aprendizagem por realimentação de relevância considerando as imagens retornadas. O primeiro paradigma tenta retornar a cada iteração sempre as imagens mais relevantes para o usuário, enquanto o segundo utiliza no aprendizado as imagens consideradas mais informativas ou difíceis de classificar. São apresentados os algoritmos de realimentação de relevância baseados em OPF utilizando ambos os paradigmas com descritor único. São utilizadas também duas técnicas de combinação de descritores juntamente com os métodos de realimentação de relevância baseados em OPF para melhorar a eficácia do processo de aprendizagem. A primeira, MSPS (Multi-Scale Parameter Search), é utilizada pela primeira vez em recuperação de imagens por conteúdo, enquanto a segunda é uma técnica consolidada baseada em programação genética. Uma nova abordagem para realimentação de relevância utilizando o classificador OPF em dois níveis de interesse é também apresentada. Nesta abordagem é possível, em um nível de interesse, selecionar os pixels nas imagens, além de escolher as imagens mais relevantes a cada iteração no outro nível. Esta tese mostra que o uso do classificador OPF para recuperação de imagens por conteúdo é muito eficiente e eficaz, necessitando de poucas iterações de aprendizado para apresentar os resultados desejados aos usuários. As simulações mostram que os métodos propostos superam os métodos de referência baseados em múltiplos pontos de consulta e em máquina de vetor de suporte (SVM). Além disso, os métodos propostos de busca de imagens baseados no classificador por floresta de caminhos ótimos mostraram ser em média 52 vezes mais rápidos do que os métodos baseados em máquina de vetor de suporte === Abstract: Considering the increasing amount of image collections that result from popularization of the digital cameras and the Internet, efficient search methods are becoming increasingly necessary. In this context, this doctoral dissertation proposes new methods for content-based image retrieval based on relevance feedback and on the OPF (optimum-path forest) classifier, being also the first time that the OPF classifier is used in small training sets. This doctoral dissertation names as "greedy" and "planned" the two distinct learning paradigms for relevance feedback taking into account the returned images. The first paradigm attempts to return the images most relevant to the user at each iteration, while the second returns the images considered the most informative or difficult to be classified. The dissertation presents relevance feedback algorithms based on the OPF classifier using both paradigms with single descriptor. Two techniques for combining descriptors are also presented along with the relevance feedback methods based on OPF to improve the effectiveness of the learning process. The first one, MSPS (Multi-Scale Search Parameter), is used for the first time in content-based image retrieval and the second is a consolidated technique based on genetic programming. A new approach of relevance feedback using the OPF classifier at two levels of interest is also shown. In this approach it is possible to select the pixels in images at a level of interest and to choose the most relevant images at each iteration at another level. This dissertation shows that the use of the OPF classifier for content based image retrieval is very efficient and effective, requiring few learning iterations to produce the desired results to the users. Simulations show that the proposed methods outperform the reference methods based on multi-point query and support vector machine. Besides, the methods based on optimum-path forest have shown to be on the average 52 times faster than the SVM-based approaches === Doutorado === Engenharia de Computação === Doutor em Engenharia Elétrica |
---|