Pre-processing approaches for collaborative filtering based on hierarchical clustering

Recommender Systems (RS) support users to find relevant content, such as movies, books, songs, and other products based on their preferences. Such preferences are gathered by analyzing past users interactions, however, data collected for this purpose are typically prone to sparsity and high dimensio...

Full description

Bibliographic Details
Main Author: Aguiar Neto, Fernando Soares de
Other Authors: Campello, Ricardo José Gabrielli Barreto
Format: Others
Language:en
Published: Biblioteca Digitais de Teses e Dissertações da USP 2018
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-25032019-102215/
id ndltd-usp.br-oai-teses.usp.br-tde-25032019-102215
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-25032019-1022152019-05-09T21:18:42Z Pre-processing approaches for collaborative filtering based on hierarchical clustering Abordagens de pré-processamento para filtragem colaborativa baseada em agrupamento hierárquico Aguiar Neto, Fernando Soares de Agrupamento de Dados Clustering Dissertação Dissertation Optimization Otimização Recommender systems Sistemas de recomendação Recommender Systems (RS) support users to find relevant content, such as movies, books, songs, and other products based on their preferences. Such preferences are gathered by analyzing past users interactions, however, data collected for this purpose are typically prone to sparsity and high dimensionality. Clustering-based techniques have been proposed to handle these problems effectively and efficiently by segmenting the data into a number of similar groups based on predefined characteristics. Although these techniques have gained increasing attention in the recommender systems community, they are usually bound to a particular recommender system and/or require critical parameters, such as the number of clusters. In this work, we present three variants of a general-purpose method to optimally extract users groups from a hierarchical clustering algorithm specifically targeting RS problems. The proposed extraction methods do not require critical parameters and can be applied prior to any recommendation system. Our experiments have shown promising recommendation results in the context of nine well-known public datasets from different domains. Sistemas de Recomendação auxiliam usuários a encontrar conteúdo relevante, como filmes, livros, músicas entre outros produtos baseando-se em suas preferências. Tais preferências são obtidas ao analisar interações passadas dos usuários, no entanto, dados coletados com esse propósito tendem a tipicamente possuir alta dimensionalidade e esparsidade. Técnicas baseadas em agrupamento de dados têm sido propostas para lidar com esses problemas de foma eficiente e eficaz ao dividir os dados em grupos similares baseando-se em características pré-definidas. Ainda que essas técnicas tenham recebido atenção crescente na comunidade de sistemas de recomendação, tais técnicas são usualmente atreladas a um algoritmo de recomendação específico e/ou requerem parâmetros críticos, como número de grupos. Neste trabalho, apresentamos três variantes de um método de propósitvo geral de extração ótima de grupos em uma hierarquia, atacando especificamente problemas em Sistemas de Recomendação. Os métodos de extração propostos não requerem parâmetros críticos e podem ser aplicados antes de qualquer sistema de recomendação. Os experimentos mostraram resultados promissores no contexto de nove bases de dados públicas conhecidas em diferentes domínios. Biblioteca Digitais de Teses e Dissertações da USP Campello, Ricardo José Gabrielli Barreto Manzato, Marcelo Garcia 2018-10-19 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/55/55134/tde-25032019-102215/ en Liberar o conteúdo para acesso público.
collection NDLTD
language en
format Others
sources NDLTD
topic Agrupamento de Dados
Clustering
Dissertação
Dissertation
Optimization
Otimização
Recommender systems
Sistemas de recomendação
spellingShingle Agrupamento de Dados
Clustering
Dissertação
Dissertation
Optimization
Otimização
Recommender systems
Sistemas de recomendação
Aguiar Neto, Fernando Soares de
Pre-processing approaches for collaborative filtering based on hierarchical clustering
description Recommender Systems (RS) support users to find relevant content, such as movies, books, songs, and other products based on their preferences. Such preferences are gathered by analyzing past users interactions, however, data collected for this purpose are typically prone to sparsity and high dimensionality. Clustering-based techniques have been proposed to handle these problems effectively and efficiently by segmenting the data into a number of similar groups based on predefined characteristics. Although these techniques have gained increasing attention in the recommender systems community, they are usually bound to a particular recommender system and/or require critical parameters, such as the number of clusters. In this work, we present three variants of a general-purpose method to optimally extract users groups from a hierarchical clustering algorithm specifically targeting RS problems. The proposed extraction methods do not require critical parameters and can be applied prior to any recommendation system. Our experiments have shown promising recommendation results in the context of nine well-known public datasets from different domains. === Sistemas de Recomendação auxiliam usuários a encontrar conteúdo relevante, como filmes, livros, músicas entre outros produtos baseando-se em suas preferências. Tais preferências são obtidas ao analisar interações passadas dos usuários, no entanto, dados coletados com esse propósito tendem a tipicamente possuir alta dimensionalidade e esparsidade. Técnicas baseadas em agrupamento de dados têm sido propostas para lidar com esses problemas de foma eficiente e eficaz ao dividir os dados em grupos similares baseando-se em características pré-definidas. Ainda que essas técnicas tenham recebido atenção crescente na comunidade de sistemas de recomendação, tais técnicas são usualmente atreladas a um algoritmo de recomendação específico e/ou requerem parâmetros críticos, como número de grupos. Neste trabalho, apresentamos três variantes de um método de propósitvo geral de extração ótima de grupos em uma hierarquia, atacando especificamente problemas em Sistemas de Recomendação. Os métodos de extração propostos não requerem parâmetros críticos e podem ser aplicados antes de qualquer sistema de recomendação. Os experimentos mostraram resultados promissores no contexto de nove bases de dados públicas conhecidas em diferentes domínios.
author2 Campello, Ricardo José Gabrielli Barreto
author_facet Campello, Ricardo José Gabrielli Barreto
Aguiar Neto, Fernando Soares de
author Aguiar Neto, Fernando Soares de
author_sort Aguiar Neto, Fernando Soares de
title Pre-processing approaches for collaborative filtering based on hierarchical clustering
title_short Pre-processing approaches for collaborative filtering based on hierarchical clustering
title_full Pre-processing approaches for collaborative filtering based on hierarchical clustering
title_fullStr Pre-processing approaches for collaborative filtering based on hierarchical clustering
title_full_unstemmed Pre-processing approaches for collaborative filtering based on hierarchical clustering
title_sort pre-processing approaches for collaborative filtering based on hierarchical clustering
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2018
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-25032019-102215/
work_keys_str_mv AT aguiarnetofernandosoaresde preprocessingapproachesforcollaborativefilteringbasedonhierarchicalclustering
AT aguiarnetofernandosoaresde abordagensdepreprocessamentoparafiltragemcolaborativabaseadaemagrupamentohierarquico
_version_ 1719072903486504960