Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos

O custo do acesso exato a dados complexos tende a ser muito alto, do ponto de vista da carga de processamento computacional. Além disso, a operação de busca em dados multimídia não é efetuada realmente sobre os dados originais, mas sobre características extraídas desses dados, as quais os descre...

Full description

Bibliographic Details
Main Author: Renato Bueno
Other Authors: Caetano Traina Junior
Language:Portuguese
Published: Universidade de São Paulo 2005
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112014-172348/
id ndltd-IBICT-oai-teses.usp.br-tde-21112014-172348
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Não disponível
Not available
spellingShingle Não disponível
Not available
Renato Bueno
Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
description O custo do acesso exato a dados complexos tende a ser muito alto, do ponto de vista da carga de processamento computacional. Além disso, a operação de busca em dados multimídia não é efetuada realmente sobre os dados originais, mas sobre características extraídas desses dados, as quais os descrevem. Por exemplo, na busca por imagens similares utilizando-se histogramas de cor, realizando uma consulta exata, o que se obtém são as imagens cujos histogramas são exatamente os mais similares aos da imagem referenciada 11a consulta, mas isso não implica necessariamente que se obtenha as imagens que atendam exatamente a consulta efetuada, pois as imagens recuperadas podem ser muito diferentes quanto a forma, por exemplo. Portanto, em muitas aplicações que acessam dados complexos, a recuperação exata deixa de um requisito fundamental, podendo a exatidão das respostas ser trocada por um melhor desempenho Neste trabalho foram desenvolvidos algoritmos para recuperação aproximada do conjunto-resposta de consultas por similaridade em domínios métricos utilizando algoritmos genéticos. Neste trabalho, com a utilização de algoritmos genéticos, foram desenvolvidas técnicas de recuperação aproximada de dados cm domínio métrico, cujo refinamento das respostas obtidas é dependente do tempo de processamento disponível, definido pelo usuário. Os algoritmos desenvolvidos foram implementados utilizando a Slim-tree, mas outros métodos de acesso podem ser extendidos para utilizá-los também. Os algoritmos contemplam consultas por abrangência e vizinhos mais próximos, além de algumas variações. Os algoritmos desenvolvidos foram testados e validados com conjuntos de dados sintéticos e reais, e mostraram-se capazes de obter respostas aproximadas com boa precisão utilizando apenas uma fração do tempo exigido pela consulta exata. Os resultados obtidos nos experimentos mostram que é possível obter respostas com precisão superior a 90% utilizando apenas metade do tempo da consulta exata com o algoritmo convencional, e até 65% de precisão com apenas um quinto do tempo da consulta exata. === I search process on complex domains for exact answer to a similarity query is an expensive process considering computational resources, such as memory and processing time requirements. However, when comparing multimédia dal,a, the comparison operations usually consider some properties of each daturn element, so exact queries involving this data return results tliat are exact regarding the properties compared, but not necessarily exact regarding the multimedia data itself. For example, searching for similar images regarding their colors return images whose color histogram are the most similar, but the retrieved images can be very different regarding for example the forni of the objects pietured. Therefore, for applications dealing with complex data types, trading exact answering with query time response can be a worth exchange. In this work we developed techniques based 011 genetic algorithms to allow retrieving approximate data indexed in a Metric Access Methods (MAMs) within a limited, user-defined, amount of time. For evaluation purposes, the algorithms were developed regarding the Slim-lrce, but the approximate query techniques developed in this work can be straightforwardly implemented on other MAMs. The algorithms can be used to perform nearest neighbor queries, range queries and some other variations. Svnthetic and real world datasets were used to evaluate the approximate algorithms, achieving good results in a fraetion of the time required to obtain the exact answer. The experimental results show that, allowing the algorithm to run during 50% of the exact query time, the precision of the approximate results is about 90%, and precision of 65% can be obtained consuming just 20% of the same exact query time.
author2 Caetano Traina Junior
author_facet Caetano Traina Junior
Renato Bueno
author Renato Bueno
author_sort Renato Bueno
title Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
title_short Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
title_full Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
title_fullStr Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
title_full_unstemmed Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
title_sort desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos
publisher Universidade de São Paulo
publishDate 2005
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112014-172348/
work_keys_str_mv AT renatobueno desenvolvimentodealgoritmosgeneticosparaconsultasporsimilaridadeemdominiosmetricos
AT renatobueno geneticalgorithmsforsimilarityqueriesinmetricspaces
_version_ 1718948197731139584
spelling ndltd-IBICT-oai-teses.usp.br-tde-21112014-1723482019-01-22T02:15:20Z Desenvolvimento de algoritmos genéticos para consultas por similaridade em domínios métricos Genetic algorithms for similarity queries in metric spaces Renato Bueno Caetano Traina Junior Karin Becker André Carlos Ponce de Leon Ferreira de Carvalho Não disponível Not available O custo do acesso exato a dados complexos tende a ser muito alto, do ponto de vista da carga de processamento computacional. Além disso, a operação de busca em dados multimídia não é efetuada realmente sobre os dados originais, mas sobre características extraídas desses dados, as quais os descrevem. Por exemplo, na busca por imagens similares utilizando-se histogramas de cor, realizando uma consulta exata, o que se obtém são as imagens cujos histogramas são exatamente os mais similares aos da imagem referenciada 11a consulta, mas isso não implica necessariamente que se obtenha as imagens que atendam exatamente a consulta efetuada, pois as imagens recuperadas podem ser muito diferentes quanto a forma, por exemplo. Portanto, em muitas aplicações que acessam dados complexos, a recuperação exata deixa de um requisito fundamental, podendo a exatidão das respostas ser trocada por um melhor desempenho Neste trabalho foram desenvolvidos algoritmos para recuperação aproximada do conjunto-resposta de consultas por similaridade em domínios métricos utilizando algoritmos genéticos. Neste trabalho, com a utilização de algoritmos genéticos, foram desenvolvidas técnicas de recuperação aproximada de dados cm domínio métrico, cujo refinamento das respostas obtidas é dependente do tempo de processamento disponível, definido pelo usuário. Os algoritmos desenvolvidos foram implementados utilizando a Slim-tree, mas outros métodos de acesso podem ser extendidos para utilizá-los também. Os algoritmos contemplam consultas por abrangência e vizinhos mais próximos, além de algumas variações. Os algoritmos desenvolvidos foram testados e validados com conjuntos de dados sintéticos e reais, e mostraram-se capazes de obter respostas aproximadas com boa precisão utilizando apenas uma fração do tempo exigido pela consulta exata. Os resultados obtidos nos experimentos mostram que é possível obter respostas com precisão superior a 90% utilizando apenas metade do tempo da consulta exata com o algoritmo convencional, e até 65% de precisão com apenas um quinto do tempo da consulta exata. I search process on complex domains for exact answer to a similarity query is an expensive process considering computational resources, such as memory and processing time requirements. However, when comparing multimédia dal,a, the comparison operations usually consider some properties of each daturn element, so exact queries involving this data return results tliat are exact regarding the properties compared, but not necessarily exact regarding the multimedia data itself. For example, searching for similar images regarding their colors return images whose color histogram are the most similar, but the retrieved images can be very different regarding for example the forni of the objects pietured. Therefore, for applications dealing with complex data types, trading exact answering with query time response can be a worth exchange. In this work we developed techniques based 011 genetic algorithms to allow retrieving approximate data indexed in a Metric Access Methods (MAMs) within a limited, user-defined, amount of time. For evaluation purposes, the algorithms were developed regarding the Slim-lrce, but the approximate query techniques developed in this work can be straightforwardly implemented on other MAMs. The algorithms can be used to perform nearest neighbor queries, range queries and some other variations. Svnthetic and real world datasets were used to evaluate the approximate algorithms, achieving good results in a fraetion of the time required to obtain the exact answer. The experimental results show that, allowing the algorithm to run during 50% of the exact query time, the precision of the approximate results is about 90%, and precision of 65% can be obtained consuming just 20% of the same exact query time. 2005-05-30 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112014-172348/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Ciências da Computação e Matemática Computacional USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP