Exploração da popularidade para busca de informação em blogs

=== The blogosphere is a highly dynamic and interconnected subset of the Web that has triggered a lot of interest due to its social and personal nature. In this dissertation, we present a study of an important social aspect of these blogs, namely popularity. The most popular blogs from four importa...

Full description

Bibliographic Details
Main Author: Luiz Guilherme Pais dos Santos
Other Authors: Marcos Andre Goncalves
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2009
Online Access:http://hdl.handle.net/1843/SLSS-7WMGFM
Description
Summary:=== The blogosphere is a highly dynamic and interconnected subset of the Web that has triggered a lot of interest due to its social and personal nature. In this dissertation, we present a study of an important social aspect of these blogs, namely popularity. The most popular blogs from four important blog domains in Brazil were crawled for a considerable period of time in order to collect information about the most popular blogs. The experiments, conducted with several volunteers, show that despite the blogosphere being a social network, popularity has been underexplored by at least the most popular search engines in the context of blog search. In the experiments, queries specifically formulated for retrieving these popular blogs were not capable of ranking them in the top positions (top 100) of the most popular search engines, and their page ranks, as measured by the typical web graph topology of links, are very low. It is also shown that explicitly incorporating popularity in the search engine algorithm produces rankings which were considered by volunteers, in general, very relevant. === A blogosfera é um subconjunto da Web altamente dinâmico e conectado que despertou um grande interesse devido à sua natureza social. Nesta dissertação, é apresentado um estudo de um importante aspecto dos blogs, a popularidade. Os blogs mais populares de quatro importantes domínios brasileiros foram coletados por um período de tempo considerável para obter informações sobre aqueles mais populares. Os experimentos realizados, com a ajuda de vários voluntários, mostram que apesar de a blogosfera ser uma rede social, a popularidade tem sido subutilizada, pelo menos pelas máquinas de busca mais importantes no contexto de busca de blogs. Nos experimentos, consultas especificamente formuladas para recuperar esses blogs populares não foram capazes de trazê-los entre as primeiras posições (100 primeiros) nas principais máquinas de busca. Mais ainda, os valores de PageRank desses blogs populares são também muito baixos. É mostrado, ainda, que incorporar explicitamente a popularidade ao algoritmo de ordenação de consultas de uma máquina de busca produz resultados que foram considerados pelos voluntários, de modo geral, bastante relevantes.