Abordagens heurísticas para problemas de agrupamentos

Os problemas de agrupamentos surgiram da necessidade de se agrupar dados a fim de entender um objeto ou um fenômeno ainda desconhecidos. O agrupamento é feito com base na similaridade entre os objetos de um conjunto de dados, em que os mais similares ficam no mesmo grupo. Este trabalho propõe três n...

Full description

Bibliographic Details
Main Author: Dalila Ribeiro Serpa
Other Authors: Luiz Antonio Nogueira Lorena
Language:Portuguese
Published: Instituto Nacional de Pesquisas Espaciais 2011
Online Access:http://urlib.net/sid.inpe.br/mtc-m19/2011/02.17.15.47
Description
Summary:Os problemas de agrupamentos surgiram da necessidade de se agrupar dados a fim de entender um objeto ou um fenômeno ainda desconhecidos. O agrupamento é feito com base na similaridade entre os objetos de um conjunto de dados, em que os mais similares ficam no mesmo grupo. Este trabalho propõe três novas abordagens heurísticas para problemas de agrupamentos: a meta-heurística Busca em Vizinhança Variável (VNS, do inglês \textit{Variable Neighborhood Search}), a meta-heurística Busca Local Iterativa (ILS, do ingles \textit{Iterated Local Search} e o método híbrido Busca por Agrupamentos (CS, do inglês \textit{Clustering Search}). O VNS é caracterizado por realizar buscas em vizinhanças distantes. O ILS realiza perturbações em uma solução gerando novas soluções de partida para a busca local. O CS, chamado de método híbrido por utilizar uma combinação de meta-heurísticas com busca local, é caracterizado por realizar buscas em regiões promissoras à melhoria da solução. Neste trabalho, estes algoritmos utilizarão a abordagem de particionamento em cliques para realizar o \textit{clustering}. Os \textit{clusters} obtidos pelos algoritmos serão avaliados por dois índices de validação externa: Rand e Corrected Rand. Além disso, uma pequena aplicação em classificação de imagens será apresentada. E por fim, os resultados obtidos serão comparados com outros algoritmos da literatura. === The clustering problems arose from the need to group data in order to understand an object or a phenomenon still unknown. Data clustering is based on similarity between objects of a data set, where the most similar objects are in the same group. This work proposes three new heuristics approaches to clustering problems: the \textit{Variable Neighborhood Search} (VNS) metaheuristic, the \textit{Iterated Local Search} (ILS) metaheuristic and the hybrid method called \textit{Clustering Search}(CS). VNS is characterized by performing searches in a distant neighborhoods. ILS performs a perturbation in a solution, generating new starting solutions to the local search. CS, called hybrid method because it uses a combination of metaheuristics with local search, is characterized by performing searches in promising regions to the solution improvement. In this work, these algorithms will use the clique partitioning approach to perform the clustering. The clusters obtained by these algorithms will be evaluated by two external validation indexes: Rand and Corrected Rand. Moreover, a little application in image classification will be presented. At the end, the results obtained will be compared with others algorithms in the literature.