Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.

O modelo de recuperação de informação mais amplamente utilizado no contexto de acervos digitais é o Vector Space Model. Algoritmos implementados para este modelo que aproveitam informações sobre relevância obtidas dos usuários (chamados feedbacks) na tentativa de melhorar os resultados da busca....

Full description

Bibliographic Details
Main Author: Fernando Hattori
Other Authors: Edson Satoshi Gomi
Language:Portuguese
Published: Universidade de São Paulo 2016
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/3/3141/tde-29082016-134043/
id ndltd-IBICT-oai-teses.usp.br-tde-29082016-134043
record_format oai_dc
spelling ndltd-IBICT-oai-teses.usp.br-tde-29082016-1340432019-01-22T00:29:43Z Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca. Term-oriented relevance feedback: a novel ranking method for search engines. Fernando Hattori Edson Satoshi Gomi Leonidas de Oliveira Brandao Ricardo Luis de Azevedo da Rocha Biblioteca digital Motores de busca Recuperação de informação Digital library Information retrieval Search engines O modelo de recuperação de informação mais amplamente utilizado no contexto de acervos digitais é o Vector Space Model. Algoritmos implementados para este modelo que aproveitam informações sobre relevância obtidas dos usuários (chamados feedbacks) na tentativa de melhorar os resultados da busca. Porém, estes algoritmos de feedback de relevância não possuem uma estratégia global e permanente, as informações obtidas desses feedbacks são descartadas para cada nova sessão de usuário (são perenes) ou não modificam os documentos como um todo (são alterações locais). Este trabalho apresenta um método de feedbacks de relevância denominado orientado a termos, permitindo que as modificações realizadas por influência dos feedbacks dos usuários sejam globais e permanentes. Foram realizados experimentos utilizando o dataset ClueWeb09 que dão evidências de que este método melhora a qualidade dos resultados da busca em relação ao modelo tradicional Vector Space Model. The Vector Space Model is the most widely used information retrieval model within digital libraries\' systems. Algorithms developed to be used with this model use relevance information obtained from users (called feedbacks) to improve the search results. However, the relevance feedback algorithms developed are not global nor permanent, the feedbacks are discarded in users new sessions and do not affect every document. This paper presents a method that uses of relevance feedback named terms oriented. In this method, users\' feedbacks lead to modifications in the terms\' vectors representations. These modifications are global and permanent, influencing further searches. An experiment was conducted using the ClueWeb09 dataset, giving evidence that this method improves the quality of search results when compared with Vector Space Model. 2016-05-23 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/3/3141/tde-29082016-134043/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Engenharia Elétrica USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP
collection NDLTD
language Portuguese
sources NDLTD
topic Biblioteca digital
Motores de busca
Recuperação de informação
Digital library
Information retrieval
Search engines
spellingShingle Biblioteca digital
Motores de busca
Recuperação de informação
Digital library
Information retrieval
Search engines
Fernando Hattori
Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
description O modelo de recuperação de informação mais amplamente utilizado no contexto de acervos digitais é o Vector Space Model. Algoritmos implementados para este modelo que aproveitam informações sobre relevância obtidas dos usuários (chamados feedbacks) na tentativa de melhorar os resultados da busca. Porém, estes algoritmos de feedback de relevância não possuem uma estratégia global e permanente, as informações obtidas desses feedbacks são descartadas para cada nova sessão de usuário (são perenes) ou não modificam os documentos como um todo (são alterações locais). Este trabalho apresenta um método de feedbacks de relevância denominado orientado a termos, permitindo que as modificações realizadas por influência dos feedbacks dos usuários sejam globais e permanentes. Foram realizados experimentos utilizando o dataset ClueWeb09 que dão evidências de que este método melhora a qualidade dos resultados da busca em relação ao modelo tradicional Vector Space Model. === The Vector Space Model is the most widely used information retrieval model within digital libraries\' systems. Algorithms developed to be used with this model use relevance information obtained from users (called feedbacks) to improve the search results. However, the relevance feedback algorithms developed are not global nor permanent, the feedbacks are discarded in users new sessions and do not affect every document. This paper presents a method that uses of relevance feedback named terms oriented. In this method, users\' feedbacks lead to modifications in the terms\' vectors representations. These modifications are global and permanent, influencing further searches. An experiment was conducted using the ClueWeb09 dataset, giving evidence that this method improves the quality of search results when compared with Vector Space Model.
author2 Edson Satoshi Gomi
author_facet Edson Satoshi Gomi
Fernando Hattori
author Fernando Hattori
author_sort Fernando Hattori
title Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
title_short Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
title_full Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
title_fullStr Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
title_full_unstemmed Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
title_sort feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca.
publisher Universidade de São Paulo
publishDate 2016
url http://www.teses.usp.br/teses/disponiveis/3/3141/tde-29082016-134043/
work_keys_str_mv AT fernandohattori feedbackderelevanciaorientadoatermosumnovometodoparaordenacaoderesultadosdemotoresdebusca
AT fernandohattori termorientedrelevancefeedbackanovelrankingmethodforsearchengines
_version_ 1718922328572690432