Uso de taxonomias na recomendação de produtos

=== In this work we investigate how to take advantage of valuable information encoded in taxonomies to improve the quality of content-based recommender systems. The use of taxonomies opens the opportunity to incorporate domain-specific and common-sense knowledge compiled by humans. Our investigatio...

Full description

Bibliographic Details
Main Author: Osvaldo Carneiro de Matos Junior
Other Authors: Nivio Ziviani
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2011
Online Access:http://hdl.handle.net/1843/SLSS-8GQH9B
id ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-SLSS-8GQH9B
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
description === In this work we investigate how to take advantage of valuable information encoded in taxonomies to improve the quality of content-based recommender systems. The use of taxonomies opens the opportunity to incorporate domain-specific and common-sense knowledge compiled by humans. Our investigation is based on a case study over the book domain, in which the recommendation target is a news web page and the items to be recommended are books from an online bookstore. This is a representative real-case application that provides an adequate context to experiment with a number of distinct strategies. We present a comprehensive study of three strategies to exploit the use of taxonomies in content-based recommender systems. Although some of these strategies have been previously applied to other related IR problems, in this paper we present a fresh perspective for their application in a new scenario. For this, we implement several methods for content-based recommendation that apply these strategie individually and in combination, exploring diverse configurations and premises. We perform a comprehensive set of experiments with a collection of 100 news pages (i.e., target pages) from The New York Times, and a collection and a taxonomy of books crawled from Amazon.com. Experimental results indicate that our strategies can be successfully applied to improving traditional content-based recommender systems. In particular, when the target page is manually assigned to a category by a user, we obtain gains close to 20% in average precision. On the other hand, if such an assignment is automatic, the gains are still representative, reaching around 13% in average precision === Sistemas de recomendação procuram compreender o interesse do usuário e gerar uma lista de recomendação com itens relacionados. Neste trabalho investigamos como obter vantagem da informação presente em taxonomias para melhorar a qualidade de sistemas de recomendação baseada em conteúdo. Adotamos o cenário onde o usuário está interessado em uma notícia publicada na Internet e um sistema de recomendação é usado para recomendar produtos, por exemplo, livros de uma livraria online. O sistema analisa o texto da notícia e, por meio de técnicas de Recuperação de Informação (RI), encontra livros semelhantes ao assunto da notícia. O uso de taxonomias abre a oportunidade de incorporar conhecimento de um domínio específico compilado por humanos. Esta dissertação apresenta um estudo de três estratégias para explorar o uso de taxonomias em sistemas de recomendação baseada em conteúdo, a saber: descritores de categoria, características de classificação e filtro de categorias. Embora algumas dessas estratégias tenham sido empregadas anteriormente para resolver outros problemas de RI, neste trabalho, essas estratégias foram aplicadas em um cenário diferente. Vários métodos de recomendação foram derivados a partir das três estratégias, explorando diversas configurações e premissas. Os experimentos foram realizados sobre uma coleção de 100 páginas de notícias (páginas alvo) do The New York Times, uma taxonomia e uma coleção de livros, ambas coletadas da Amazon.com. Os resultados experimentais mostram que as estratégias consideradas podem ser aplicadas com sucesso para melhorar os sistemas de recomendação baseada em conteúdo. Em particular, quando a página alvo é manualmente associada a uma categoria por humanos, os ganhos são próximos de 20% na precisão média. Por outro lado, se essa associação é automática, os ganhos ainda são representativos e próximos de 13% na precisão média.
author2 Nivio Ziviani
author_facet Nivio Ziviani
Osvaldo Carneiro de Matos Junior
author Osvaldo Carneiro de Matos Junior
spellingShingle Osvaldo Carneiro de Matos Junior
Uso de taxonomias na recomendação de produtos
author_sort Osvaldo Carneiro de Matos Junior
title Uso de taxonomias na recomendação de produtos
title_short Uso de taxonomias na recomendação de produtos
title_full Uso de taxonomias na recomendação de produtos
title_fullStr Uso de taxonomias na recomendação de produtos
title_full_unstemmed Uso de taxonomias na recomendação de produtos
title_sort uso de taxonomias na recomendação de produtos
publisher Universidade Federal de Minas Gerais
publishDate 2011
url http://hdl.handle.net/1843/SLSS-8GQH9B
work_keys_str_mv AT osvaldocarneirodematosjunior usodetaxonomiasnarecomendacaodeprodutos
_version_ 1718844626584993792
spelling ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-SLSS-8GQH9B2019-01-21T17:56:25Z Uso de taxonomias na recomendação de produtos Osvaldo Carneiro de Matos Junior Nivio Ziviani Alberto Henrique Frade Laender Wagner Meira Junior In this work we investigate how to take advantage of valuable information encoded in taxonomies to improve the quality of content-based recommender systems. The use of taxonomies opens the opportunity to incorporate domain-specific and common-sense knowledge compiled by humans. Our investigation is based on a case study over the book domain, in which the recommendation target is a news web page and the items to be recommended are books from an online bookstore. This is a representative real-case application that provides an adequate context to experiment with a number of distinct strategies. We present a comprehensive study of three strategies to exploit the use of taxonomies in content-based recommender systems. Although some of these strategies have been previously applied to other related IR problems, in this paper we present a fresh perspective for their application in a new scenario. For this, we implement several methods for content-based recommendation that apply these strategie individually and in combination, exploring diverse configurations and premises. We perform a comprehensive set of experiments with a collection of 100 news pages (i.e., target pages) from The New York Times, and a collection and a taxonomy of books crawled from Amazon.com. Experimental results indicate that our strategies can be successfully applied to improving traditional content-based recommender systems. In particular, when the target page is manually assigned to a category by a user, we obtain gains close to 20% in average precision. On the other hand, if such an assignment is automatic, the gains are still representative, reaching around 13% in average precision Sistemas de recomendação procuram compreender o interesse do usuário e gerar uma lista de recomendação com itens relacionados. Neste trabalho investigamos como obter vantagem da informação presente em taxonomias para melhorar a qualidade de sistemas de recomendação baseada em conteúdo. Adotamos o cenário onde o usuário está interessado em uma notícia publicada na Internet e um sistema de recomendação é usado para recomendar produtos, por exemplo, livros de uma livraria online. O sistema analisa o texto da notícia e, por meio de técnicas de Recuperação de Informação (RI), encontra livros semelhantes ao assunto da notícia. O uso de taxonomias abre a oportunidade de incorporar conhecimento de um domínio específico compilado por humanos. Esta dissertação apresenta um estudo de três estratégias para explorar o uso de taxonomias em sistemas de recomendação baseada em conteúdo, a saber: descritores de categoria, características de classificação e filtro de categorias. Embora algumas dessas estratégias tenham sido empregadas anteriormente para resolver outros problemas de RI, neste trabalho, essas estratégias foram aplicadas em um cenário diferente. Vários métodos de recomendação foram derivados a partir das três estratégias, explorando diversas configurações e premissas. Os experimentos foram realizados sobre uma coleção de 100 páginas de notícias (páginas alvo) do The New York Times, uma taxonomia e uma coleção de livros, ambas coletadas da Amazon.com. Os resultados experimentais mostram que as estratégias consideradas podem ser aplicadas com sucesso para melhorar os sistemas de recomendação baseada em conteúdo. Em particular, quando a página alvo é manualmente associada a uma categoria por humanos, os ganhos são próximos de 20% na precisão média. Por outro lado, se essa associação é automática, os ganhos ainda são representativos e próximos de 13% na precisão média. 2011-02-28 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1843/SLSS-8GQH9B por info:eu-repo/semantics/openAccess text/html Universidade Federal de Minas Gerais 32001010004P6 - CIÊNCIA DA COMPUTAÇÃO UFMG BR reponame:Biblioteca Digital de Teses e Dissertações da UFMG instname:Universidade Federal de Minas Gerais instacron:UFMG