Summary: | === In this work we investigate how to take advantage of valuable information encoded in taxonomies to improve the quality of content-based recommender systems. The use of taxonomies opens the opportunity to incorporate domain-specific and common-sense
knowledge compiled by humans. Our investigation is based on a case study over the book domain, in which the recommendation target is a news web page and the items to be recommended are books from an online bookstore. This is a representative real-case application that provides an adequate context to experiment with a number of distinct
strategies. We present a comprehensive study of three strategies to exploit the use of taxonomies in content-based recommender systems. Although some of these strategies have been previously applied to other related IR problems, in this paper we present a fresh perspective for their application in a new scenario. For this, we implement several methods for content-based recommendation that apply these strategie individually
and in combination, exploring diverse configurations and premises. We perform a comprehensive set of experiments with a collection of 100 news pages (i.e., target pages) from The New York Times, and a collection and a taxonomy of books crawled from Amazon.com. Experimental results indicate that our strategies can be successfully
applied to improving traditional content-based recommender systems. In particular, when the target page is manually assigned to a category by a user, we obtain gains close to 20% in average precision. On the other hand, if such an assignment is automatic, the gains are still representative, reaching around 13% in average precision === Sistemas de recomendação procuram compreender o interesse do usuário e gerar uma lista de recomendação com itens relacionados. Neste trabalho investigamos como obter vantagem da informação presente em taxonomias para melhorar a qualidade de sistemas
de recomendação baseada em conteúdo. Adotamos o cenário onde o usuário está interessado em uma notícia publicada na Internet e um sistema de recomendação é usado para recomendar produtos, por exemplo, livros de uma livraria online. O sistema analisa o texto da notícia e, por meio de técnicas de Recuperação de Informação
(RI), encontra livros semelhantes ao assunto da notícia. O uso de taxonomias abre a oportunidade de incorporar conhecimento de um domínio específico compilado por humanos. Esta dissertação apresenta um estudo de três estratégias para explorar o uso de
taxonomias em sistemas de recomendação baseada em conteúdo, a saber: descritores de categoria, características de classificação e filtro de categorias. Embora algumas dessas estratégias tenham sido empregadas anteriormente para resolver outros problemas de
RI, neste trabalho, essas estratégias foram aplicadas em um cenário diferente. Vários métodos de recomendação foram derivados a partir das três estratégias, explorando diversas configurações e premissas. Os experimentos foram realizados sobre uma coleção de 100 páginas de notícias (páginas alvo) do The New York Times, uma taxonomia
e uma coleção de livros, ambas coletadas da Amazon.com. Os resultados experimentais mostram que as estratégias consideradas podem ser aplicadas com sucesso para melhorar os sistemas de recomendação baseada em conteúdo. Em particular, quando
a página alvo é manualmente associada a uma categoria por humanos, os ganhos são próximos de 20% na precisão média. Por outro lado, se essa associação é automática, os ganhos ainda são representativos e próximos de 13% na precisão média.
|