XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO === O ambiente baseado em hyperlink possui na sua topologia informações substanciais sobre o seu conteúdo. Baseado nesse tipo de ambiente, Jon Kleingerg desenvolveu um conjunto de algoritmos, popularmente conhecido como HITS (Hyperlink Induced To...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
2005
|
Online Access: | http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=7081@1 http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=7081@2 |
id |
ndltd-IBICT-oai-MAXWELL.puc-rio.br-7081 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
description |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO === O ambiente baseado em hyperlink possui na sua topologia
informações
substanciais sobre o seu conteúdo. Baseado nesse tipo de
ambiente, Jon
Kleingerg desenvolveu um conjunto de algoritmos,
popularmente conhecido como
HITS (Hyperlink Induced Topic Search), que utiliza a
estrutura de hyperlinks na
WWW para extrair essas informações. O foco central desses
algoritmos é a
classificação de tópicos de busca de caráter geral na WWW,
através da descoberta
de páginas que representam autoridade sobre tais tópicos.
Para tanto, os
algoritmos formulam a noção de autoridade considerando o
relacionamento,
decorrente da estrutura de hyperlink, entre o conjunto de
páginas que são
autoridades relevantes e o conjunto de páginas que apontam
para essas,
denominadas de hubs. Jon Kleingerg definiu, portanto, uma
relação de
interdependência entre os conjuntos anteriormente citados:
uma boa autoridade
será uma página apontada por bons hubs e um bom hub será
uma página que
aponta para boas autoridades. Neste trabalho, propomos a
extensão do modelo
formulado por Jon Kleingerg, através da inserção de novos
conceitos nas relações
de interdependência entre autoridades e hubs. Assim,
formulamos um algoritmo
estendido, XHITS (Extended Hyperlink Induced Topic
Search), que visa melhorar a
classificação das autoridades do ambiente. Nessa extensão
as autoridades são
apontadas por bons hubs, às vezes apontadas por bons
portais e também apontam
para boas novidades. Os bons hubs são páginas que apontam
para boas
autoridades e novidades, e são apontados por bons portais.
As boas novidades
são páginas que são apontadas pelas boas autoridades,
pelos bons hubs e pelos
bons portais e bons portais são páginas que apontam para
as boas autoridades,
para bons hubs e para boas novidades. Adicionalmente,
mostramos que o
algoritmo proposto converge e também os diversos
resultados experimentais que
indicam a melhoria na precisão dos hiperdocumentos
recuperados. === The network structure of a hyperlinked environment can be
a rich source
of information about the content of this environment. Jon
Kleinberg developed a
set of algorithms, called HITS (Hyperlink Induced Topic
Search), for extracting
information from the hyperlink structures of those
environments. The aim of
these algorithms is the distillation of broad search
topics, through the discovery
of related authoritative information sources. The notion
of authority is based on
the hyperlink structure relationship between a set of
relevant authoritative pages
and the set of hubs. Thus, hubs and authorities exhibit
what could be called a
mutually reinforcing relationship: a good hub is a page
that points to many good
authorities; a good authority is a page that is pointed by
many good hubs. In this
work, we present the XHITS (Extended Hyperlink Induced
Topic Search)
algorithm, an extension of the HITS algorithm by
introducing new concepts on
the mutually reinforcing relationship. In XHITS, a good
authority is a page that is
pointed by many good hubs, some good portals and points to
good novels; a
good hub is a page that points to many good authorities,
some good novels and
is pointed by some good portals; and a good novel is a
page that is pointed by
good authorities, some good hubs and some good portals; a
good portal is a
page that points to some good authorities, some good hubs
and some good
novels. In addition, we show that XHITS converges and,
through some
experiments, the improved quality of the hyper documents
retrieved. |
author2 |
RUY LUIZ MILIDIU |
author_facet |
RUY LUIZ MILIDIU FRANCISCO BENJAMIM FILHO |
author |
FRANCISCO BENJAMIM FILHO |
spellingShingle |
FRANCISCO BENJAMIM FILHO XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW |
author_sort |
FRANCISCO BENJAMIM FILHO |
title |
XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW |
title_short |
XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW |
title_full |
XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW |
title_fullStr |
XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW |
title_full_unstemmed |
XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW |
title_sort |
xhits: extending the hits algorithm for distillation of broad search topic on www |
publisher |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO |
publishDate |
2005 |
url |
http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=7081@1 http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=7081@2 |
work_keys_str_mv |
AT franciscobenjamimfilho xhitsextendingthehitsalgorithmfordistillationofbroadsearchtopiconwww AT franciscobenjamimfilho xhitsestendendooalgoritmohitsparaextracaodetopicosnawww |
_version_ |
1718986536995782656 |
spelling |
ndltd-IBICT-oai-MAXWELL.puc-rio.br-70812019-03-01T15:35:09Z XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW FRANCISCO BENJAMIM FILHO RUY LUIZ MILIDIU MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO DANIEL SCHWABE RUY LUIZ MILIDIU RAUL PIERRE RENTERIA PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO O ambiente baseado em hyperlink possui na sua topologia informações substanciais sobre o seu conteúdo. Baseado nesse tipo de ambiente, Jon Kleingerg desenvolveu um conjunto de algoritmos, popularmente conhecido como HITS (Hyperlink Induced Topic Search), que utiliza a estrutura de hyperlinks na WWW para extrair essas informações. O foco central desses algoritmos é a classificação de tópicos de busca de caráter geral na WWW, através da descoberta de páginas que representam autoridade sobre tais tópicos. Para tanto, os algoritmos formulam a noção de autoridade considerando o relacionamento, decorrente da estrutura de hyperlink, entre o conjunto de páginas que são autoridades relevantes e o conjunto de páginas que apontam para essas, denominadas de hubs. Jon Kleingerg definiu, portanto, uma relação de interdependência entre os conjuntos anteriormente citados: uma boa autoridade será uma página apontada por bons hubs e um bom hub será uma página que aponta para boas autoridades. Neste trabalho, propomos a extensão do modelo formulado por Jon Kleingerg, através da inserção de novos conceitos nas relações de interdependência entre autoridades e hubs. Assim, formulamos um algoritmo estendido, XHITS (Extended Hyperlink Induced Topic Search), que visa melhorar a classificação das autoridades do ambiente. Nessa extensão as autoridades são apontadas por bons hubs, às vezes apontadas por bons portais e também apontam para boas novidades. Os bons hubs são páginas que apontam para boas autoridades e novidades, e são apontados por bons portais. As boas novidades são páginas que são apontadas pelas boas autoridades, pelos bons hubs e pelos bons portais e bons portais são páginas que apontam para as boas autoridades, para bons hubs e para boas novidades. Adicionalmente, mostramos que o algoritmo proposto converge e também os diversos resultados experimentais que indicam a melhoria na precisão dos hiperdocumentos recuperados. The network structure of a hyperlinked environment can be a rich source of information about the content of this environment. Jon Kleinberg developed a set of algorithms, called HITS (Hyperlink Induced Topic Search), for extracting information from the hyperlink structures of those environments. The aim of these algorithms is the distillation of broad search topics, through the discovery of related authoritative information sources. The notion of authority is based on the hyperlink structure relationship between a set of relevant authoritative pages and the set of hubs. Thus, hubs and authorities exhibit what could be called a mutually reinforcing relationship: a good hub is a page that points to many good authorities; a good authority is a page that is pointed by many good hubs. In this work, we present the XHITS (Extended Hyperlink Induced Topic Search) algorithm, an extension of the HITS algorithm by introducing new concepts on the mutually reinforcing relationship. In XHITS, a good authority is a page that is pointed by many good hubs, some good portals and points to good novels; a good hub is a page that points to many good authorities, some good novels and is pointed by some good portals; and a good novel is a page that is pointed by good authorities, some good hubs and some good portals; a good portal is a page that points to some good authorities, some good hubs and some good novels. In addition, we show that XHITS converges and, through some experiments, the improved quality of the hyper documents retrieved. 2005-04-04 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=7081@1 http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=7081@2 por info:eu-repo/semantics/openAccess PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO PPG EM INFORMÁTICA PUC-Rio BR reponame:Repositório Institucional da PUC_RIO instname:Pontifícia Universidade Católica do Rio de Janeiro instacron:PUC_RIO |