Busca eficiente em redes sociais
=== Search-engines use link-based signals, like pagerank ou authority, to improve the quality of the results. However, in other scenarios where these signals are either not appropriate or impossible to calculate, some other form of trust signal must be used. For instance, in the case of social netw...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
Universidade Federal de Minas Gerais
2007
|
Online Access: | http://hdl.handle.net/1843/RVMR-7CTR43 |
id |
ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-RVMR-7CTR43 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-RVMR-7CTR432019-01-21T18:03:33Z Busca eficiente em redes sociais Monique Vaz Vieira Berthier Ribeiro de Araujo Neto Paulo B. Góes Paulo B. Góes Alberto Henrique Frade Laender Marcos Andre Goncalves Nivio Ziviani Search-engines use link-based signals, like pagerank ou authority, to improve the quality of the results. However, in other scenarios where these signals are either not appropriate or impossible to calculate, some other form of trust signal must be used. For instance, in the case of social networks, one alternative signal to improve a search for a given person are friends relationships. To illustrate, if John is looking for Maria, a good ranking function would favor the Maria's that are closer to John. However, if the relationships graph is large, computing these distance efficiently is non-trivial. To overcome this, we propose a seeds-based approximation algorithm that can speed up execution times on the Orkut social network by three orders of magnitude with respect to the brute force solution, while keeping the approximation error on the ranking smaller than 30%. By reducing the speedup to two orders of magnitude, we are able to attain approximation errors smaller than 12%. These results show that great speed up can be attained for computing friendship distances in social networks - a crucial signal for search ranking - within acceptable error margins. Redes sociais são utilizadas para a interação entre as pessoas. Uma das principais operações de uma rede social é a busca por um usuário. Enquanto máquinas de busca utilizam sinais baseados em sua estrutura de enlaces (links), como Pagerank e autoridade, para melhorar a qualidade de seus resultados, em uma rede social, esses sinais não são apropriados. Nesse caso, um sinal alternativo para melhorar a busca por uma pessoa são os relacionamentos de amizade definidos na rede social. Para ilustrar, se João procura por Maria, uma boa função de ordenação daria maior peso para as Marias mais próximas do círculo de relacionamento de João. Entretanto, se o grafo de relacionamentos é grande, a computação eficiente dessas distâncias deixa de ser um problema trivial. Diante desse problema, propomos um algoritmo baseado em sementes que aproxima as distâncias de maneira eficiente, e pode oferecer ganhos nos tempos de execução no Orkut de até três ordens de grandeza com relação à solução força bruta, mantendo precisões acima de 70%. Reduzindo o ganho nos tempos de execução para duas ordens de grandeza, a precisão dos resultados ultrapassa 90%. Esses resultados mostram que é possível obter excelentes ganhos de desempenho na computação de distâncias de relacionamento em redes sociais - um sinal crucial para a busca dentro de margens de erro aceitáveis, o que viabiliza a utilização desse importante sinal em redes sociais de grande porte. 2007-03-30 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1843/RVMR-7CTR43 por info:eu-repo/semantics/openAccess text/html Universidade Federal de Minas Gerais 32001010004P6 - CIÊNCIA DA COMPUTAÇÃO UFMG BR reponame:Biblioteca Digital de Teses e Dissertações da UFMG instname:Universidade Federal de Minas Gerais instacron:UFMG |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
description |
=== Search-engines use link-based signals, like pagerank ou authority, to improve the quality of the results. However, in other scenarios where these signals are either not appropriate or impossible to calculate, some other form of trust signal must be used. For instance, in the case of social networks, one alternative signal to improve a search for a given person are friends relationships. To illustrate, if John is looking for Maria, a good ranking function would favor the Maria's that are closer to John. However, if the relationships graph is large, computing these distance efficiently is non-trivial. To overcome this, we propose a seeds-based approximation algorithm that can speed up execution times on the Orkut social network by three orders of magnitude with respect to the brute force solution, while keeping the approximation error on the ranking smaller than 30%. By reducing the speedup to two orders of magnitude, we are able to attain approximation errors smaller than 12%. These results show that great speed up can be attained for computing friendship distances in social networks - a crucial signal for search ranking - within acceptable error margins. === Redes sociais são utilizadas para a interação entre as pessoas. Uma das principais operações de uma rede social é a busca por um usuário. Enquanto máquinas de busca utilizam sinais baseados em sua estrutura de enlaces (links), como Pagerank e autoridade, para melhorar a qualidade de seus resultados, em uma rede social, esses sinais não são apropriados. Nesse caso, um sinal alternativo para melhorar a busca por uma pessoa são os relacionamentos de amizade definidos na rede social. Para ilustrar, se João procura por Maria, uma boa função de ordenação daria maior peso para as Marias mais próximas do círculo de relacionamento de João. Entretanto, se o grafo de relacionamentos é grande, a computação eficiente dessas distâncias deixa de ser um problema trivial. Diante desse problema, propomos um algoritmo baseado em sementes que aproxima as distâncias de maneira eficiente, e pode oferecer ganhos nos tempos de execução no Orkut de até três ordens de grandeza com relação à solução força bruta, mantendo precisões acima de 70%. Reduzindo o ganho nos tempos de execução para duas ordens de grandeza, a precisão dos resultados ultrapassa 90%. Esses resultados mostram que é possível obter excelentes ganhos de desempenho na computação de distâncias de relacionamento em redes sociais - um sinal crucial para a busca dentro de margens de erro aceitáveis, o que viabiliza a utilização desse importante sinal em redes sociais de grande porte. |
author2 |
Berthier Ribeiro de Araujo Neto |
author_facet |
Berthier Ribeiro de Araujo Neto Monique Vaz Vieira |
author |
Monique Vaz Vieira |
spellingShingle |
Monique Vaz Vieira Busca eficiente em redes sociais |
author_sort |
Monique Vaz Vieira |
title |
Busca eficiente em redes sociais |
title_short |
Busca eficiente em redes sociais |
title_full |
Busca eficiente em redes sociais |
title_fullStr |
Busca eficiente em redes sociais |
title_full_unstemmed |
Busca eficiente em redes sociais |
title_sort |
busca eficiente em redes sociais |
publisher |
Universidade Federal de Minas Gerais |
publishDate |
2007 |
url |
http://hdl.handle.net/1843/RVMR-7CTR43 |
work_keys_str_mv |
AT moniquevazvieira buscaeficienteemredessociais |
_version_ |
1718846422938288128 |