Summary: | O custo do acesso exato a dados complexos tende a ser muito alto, do ponto de vista da carga de processamento computacional. Além disso, a operação de busca em dados multimídia não é efetuada realmente sobre os dados originais, mas sobre características extraídas desses dados, as quais os descrevem. Por exemplo, na busca por imagens similares utilizando-se histogramas de cor, realizando uma consulta exata, o que se obtém são as imagens cujos histogramas são exatamente os mais similares aos da imagem referenciada 11a consulta, mas isso não implica necessariamente que se obtenha as imagens que atendam exatamente a consulta efetuada, pois as imagens recuperadas podem ser muito diferentes quanto a forma, por exemplo. Portanto, em muitas aplicações que acessam dados complexos, a recuperação exata deixa de um requisito fundamental, podendo a exatidão das respostas ser trocada por um melhor desempenho Neste trabalho foram desenvolvidos algoritmos para recuperação aproximada do conjunto-resposta de consultas por similaridade em domínios métricos utilizando algoritmos genéticos. Neste trabalho, com a utilização de algoritmos genéticos, foram desenvolvidas técnicas de recuperação aproximada de dados cm domínio métrico, cujo refinamento das respostas obtidas é dependente do tempo de processamento disponível, definido pelo usuário. Os algoritmos desenvolvidos foram implementados utilizando a Slim-tree, mas outros métodos de acesso podem ser extendidos para utilizá-los também. Os algoritmos contemplam consultas por abrangência e vizinhos mais próximos, além de algumas variações. Os algoritmos desenvolvidos foram testados e validados com conjuntos de dados sintéticos e reais, e mostraram-se capazes de obter respostas aproximadas com boa precisão utilizando apenas uma fração do tempo exigido pela consulta exata. Os resultados obtidos nos experimentos mostram que é possível obter respostas com precisão superior a 90% utilizando apenas metade do tempo da consulta exata com o algoritmo convencional, e até 65% de precisão com apenas um quinto do tempo da consulta exata.
===
I search process on complex domains for exact answer to a similarity query is an expensive process considering computational resources, such as memory and processing time requirements. However, when comparing multimédia dal,a, the comparison operations usually consider some properties of each daturn element, so exact queries involving this data return results tliat are exact regarding the properties compared, but not necessarily exact regarding the multimedia data itself. For example, searching for similar images regarding their colors return images whose color histogram are the most similar, but the retrieved images can be very different regarding for example the forni of the objects pietured. Therefore, for applications dealing with complex data types, trading exact answering with query time response can be a worth exchange. In this work we developed techniques based 011 genetic algorithms to allow retrieving approximate data indexed in a Metric Access Methods (MAMs) within a limited, user-defined, amount of time. For evaluation purposes, the algorithms were developed regarding the Slim-lrce, but the approximate query techniques developed in this work can be straightforwardly implemented on other MAMs. The algorithms can be used to perform nearest neighbor queries, range queries and some other variations. Svnthetic and real world datasets were used to evaluate the approximate algorithms, achieving good results in a fraetion of the time required to obtain the exact answer. The experimental results show that, allowing the algorithm to run during 50% of the exact query time, the precision of the approximate results is about 90%, and precision of 65% can be obtained consuming just 20% of the same exact query time.
|