Uma abordagem evolutiva para combinação de fontes de evidência de relevância em máquinas de busca

Made available in DSpace on 2015-04-11T14:03:21Z (GMT). No. of bitstreams: 1 Thomaz Philippe Cavalcante Silva.pdf: 477958 bytes, checksum: f2d356a7d29673f431c4aa41d9c41d11 (MD5) Previous issue date: 2008-04-07 === CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico === Modern se...

Full description

Bibliographic Details
Main Author: Silva, Thomaz Philippe Cavalcante
Other Authors: Moura, Edleno Silva de
Format: Others
Language:Portuguese
Published: Universidade Federal do Amazonas 2015
Subjects:
Web
Online Access:http://tede.ufam.edu.br/handle/tede/2966
Description
Summary:Made available in DSpace on 2015-04-11T14:03:21Z (GMT). No. of bitstreams: 1 Thomaz Philippe Cavalcante Silva.pdf: 477958 bytes, checksum: f2d356a7d29673f431c4aa41d9c41d11 (MD5) Previous issue date: 2008-04-07 === CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico === Modern search engines use different strategies to improve the quality of their answers. An important strategy is to get an ordered list of documents based on lists produced by different sources of evidence. This work studies the use of a evolutionary technique to generate good functions of combination of three different sources of evidence: the textual content of the documents, the connecting structures between the documents in a collection and the concatenation of anchor texts pointing to each document. The functions Combination findings in this study were tested in two separate collections: the first contains queries and document a real Web search engine that contains some 12 million documents and the second is to LETOR reference collection, created to allow the fair comparison between collating functions learning methods. The experiments indicate that the studied approach here is a practical and effective alternative to combining different sources of evidence in a single list of answers. We also checked different query classes require different functions combination of sources of evidence and show that our approach is feasible to identify good features. === Máquinas de busca modernas utilizam diferentes estratégias para melhorar a qualidade de suas respostas. Uma estratégia importante é obter uma única lista ordenada de documentos baseada em listas produzidas por diferentes fontes de evidência. Este trabalho estuda o uso de uma técnica evolutiva para gerar boas funções de combinação de três diferentes fontes de evidência: o conteúdo textual dos documentos, as estruturas de ligação entre os documentos de uma coleção e a concatenação dos textos de âncora que apontam para cada documento. As funções de combinação descobertas neste trabalho foram testadas em duas coleções distintas: a primeira contém consultas e documentos de uma máquina de busca real da Web que contém cerca de 12 milhões de documentos e a segunda é a coleção de referência LETOR, criada para permitir a justa comparação entre métodos de aprendizagem de funções de ordenação. Os experimentos indicam que a abordagem estudada aqui é uma alternativa prática e efetiva para combinação de diferentes fontes de evidência em uma única lista de respostas. Nós verificamos também que diferentes classes de consultas necessitam de diferentes funções de combinação de fontes de evidência e mostramos que nossa abordagem é viável em identificar boas funções.