Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento

A fim de auxiliar usuários durante o consumo de produtos, sistemas Web passaram a incorporar módulos de recomendação de itens. As abordagens mais populares são a baseada em conteúdo, que recomenda itens a partir de características que são do seu interesse, e a filtragem colaborativa, que recomen...

Full description

Bibliographic Details
Main Author: Salmo Marques da Silva Junior
Other Authors: Marcelo Garcia Manzato
Language:Portuguese
Published: Universidade de São Paulo 2017
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13092017-143709/
id ndltd-IBICT-oai-teses.usp.br-tde-13092017-143709
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Cenário de partida fria
Distância semântica
Filtragem colaborativa
Modelos de vizinhança
Similaridade semântica
Cold start scenario
Content-based filtering
Neighborhood models
Semantic distance
Semantic similarity
spellingShingle Cenário de partida fria
Distância semântica
Filtragem colaborativa
Modelos de vizinhança
Similaridade semântica
Cold start scenario
Content-based filtering
Neighborhood models
Semantic distance
Semantic similarity
Salmo Marques da Silva Junior
Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
description A fim de auxiliar usuários durante o consumo de produtos, sistemas Web passaram a incorporar módulos de recomendação de itens. As abordagens mais populares são a baseada em conteúdo, que recomenda itens a partir de características que são do seu interesse, e a filtragem colaborativa, que recomenda itens bem avaliados por usuários com perfis semelhantes ao do usuário alvo, ou que são semelhantes aos que foram bem avaliados pelo usuário alvo. Enquanto que a primeira abordagem apresenta limitações como a sobre-especialização e a análise limitada de conteúdo, a segunda enfrenta problemas como o novo usuário e/ou novo item, também conhecido como partida fria. Apesar da variedade de técnicas disponíveis, um problema comum existente na maioria das abordagens é a falta de informações semânticas para representar os itens do acervo. Trabalhos recentes na área de Sistemas de Recomendação têm estudado a possibilidade de usar bases de conhecimento da Web como fonte de informações semânticas. Contudo, ainda é necessário investigar como usufruir de tais informações e integrá-las de modo eficiente em sistemas de recomendação. Dessa maneira, este trabalho tem o objetivo de investigar como informações semânticas provenientes de bases de conhecimento podem beneficiar sistemas de recomendação por meio da descrição semântica de itens, e como o cálculo da similaridade semântica pode amenizar o desafio enfrentado no cenário de partida fria. Como resultado, obtém-se uma técnica que pode gerar recomendações adequadas ao perfil dos usuários, incluindo itens novos do acervo que sejam relevantes. Pode-se observar uma melhora de até 10% no RMSE, no cenário de partida fria, quando se compara o sistema proposto com o sistema cuja predição de notas é baseada na correlação de notas. === In order to support users during the consumption of products,Web systems have incorporated recommendation techniques. The most popular approaches are content-based, which recommends items based on interesting features to the user, and collaborative filtering, which recommends items that were well evaluated by users with similar preferences to the target user, or that have similar features to items which were positively evaluated. While the first approach has limitations such as overspecialization and limited content analysis, the second technique has problems such as the new user and the new item, limitation also known as cold start. In spite of the variety of techniques available, a common problem is the lack of semantic information to represent items features. Recent works in the field of recommender systems have been studying the possibility to use knowledge databases from the Web as a source of semantic information. However, it is still necessary to investigate how to use and integrate such semantic information in recommender systems. In this way, this work has the proposal to investigate how semantic information gathered from knowledge databases can help recommender systems by semantically describing items, and how semantic similarity can overcome the challenge confronted in the cold-start scenario. As a result, we obtained a technique that can produce recommendations suited to users profiles, including relevant new items available in the database. It can be observed an improvement of up to 10% in the RMSE in the cold start scenario when comparing the proposed system with the system whose rating prediction is based on the correlation of rates.
author2 Marcelo Garcia Manzato
author_facet Marcelo Garcia Manzato
Salmo Marques da Silva Junior
author Salmo Marques da Silva Junior
author_sort Salmo Marques da Silva Junior
title Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
title_short Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
title_full Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
title_fullStr Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
title_full_unstemmed Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
title_sort recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento
publisher Universidade de São Paulo
publishDate 2017
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13092017-143709/
work_keys_str_mv AT salmomarquesdasilvajunior recomendacaodeconteudobaseadaeminformacoessemanticasextraidasdebasesdeconhecimento
AT salmomarquesdasilvajunior contentrecommendationbasedonsemanticinformationextractedfromknowledgebases
_version_ 1718891116705611776
spelling ndltd-IBICT-oai-teses.usp.br-tde-13092017-1437092019-01-21T22:07:52Z Recomendação de conteúdo baseada em informações semânticas extraídas de bases de conhecimento Content recommendation based on semantic information extracted from knowledge bases Salmo Marques da Silva Junior Marcelo Garcia Manzato Frederico Araújo Durão Dilvan de Abreu Moreira Flávio Luis Cardeal Pádua Cenário de partida fria Distância semântica Filtragem colaborativa Modelos de vizinhança Similaridade semântica Cold start scenario Content-based filtering Neighborhood models Semantic distance Semantic similarity A fim de auxiliar usuários durante o consumo de produtos, sistemas Web passaram a incorporar módulos de recomendação de itens. As abordagens mais populares são a baseada em conteúdo, que recomenda itens a partir de características que são do seu interesse, e a filtragem colaborativa, que recomenda itens bem avaliados por usuários com perfis semelhantes ao do usuário alvo, ou que são semelhantes aos que foram bem avaliados pelo usuário alvo. Enquanto que a primeira abordagem apresenta limitações como a sobre-especialização e a análise limitada de conteúdo, a segunda enfrenta problemas como o novo usuário e/ou novo item, também conhecido como partida fria. Apesar da variedade de técnicas disponíveis, um problema comum existente na maioria das abordagens é a falta de informações semânticas para representar os itens do acervo. Trabalhos recentes na área de Sistemas de Recomendação têm estudado a possibilidade de usar bases de conhecimento da Web como fonte de informações semânticas. Contudo, ainda é necessário investigar como usufruir de tais informações e integrá-las de modo eficiente em sistemas de recomendação. Dessa maneira, este trabalho tem o objetivo de investigar como informações semânticas provenientes de bases de conhecimento podem beneficiar sistemas de recomendação por meio da descrição semântica de itens, e como o cálculo da similaridade semântica pode amenizar o desafio enfrentado no cenário de partida fria. Como resultado, obtém-se uma técnica que pode gerar recomendações adequadas ao perfil dos usuários, incluindo itens novos do acervo que sejam relevantes. Pode-se observar uma melhora de até 10% no RMSE, no cenário de partida fria, quando se compara o sistema proposto com o sistema cuja predição de notas é baseada na correlação de notas. In order to support users during the consumption of products,Web systems have incorporated recommendation techniques. The most popular approaches are content-based, which recommends items based on interesting features to the user, and collaborative filtering, which recommends items that were well evaluated by users with similar preferences to the target user, or that have similar features to items which were positively evaluated. While the first approach has limitations such as overspecialization and limited content analysis, the second technique has problems such as the new user and the new item, limitation also known as cold start. In spite of the variety of techniques available, a common problem is the lack of semantic information to represent items features. Recent works in the field of recommender systems have been studying the possibility to use knowledge databases from the Web as a source of semantic information. However, it is still necessary to investigate how to use and integrate such semantic information in recommender systems. In this way, this work has the proposal to investigate how semantic information gathered from knowledge databases can help recommender systems by semantically describing items, and how semantic similarity can overcome the challenge confronted in the cold-start scenario. As a result, we obtained a technique that can produce recommendations suited to users profiles, including relevant new items available in the database. It can be observed an improvement of up to 10% in the RMSE in the cold start scenario when comparing the proposed system with the system whose rating prediction is based on the correlation of rates. 2017-05-10 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13092017-143709/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Ciências da Computação e Matemática Computacional USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP