Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada

A Clusterização de dados em grupos oferece uma maneira de entender e extrair informações relevantes de grandes conjuntos de dados. A abordagem em relação a aspectos como a representação dos dados e medida de similaridade entre clusters, e a necessidade de ajuste de parâmetros iniciais são as princip...

Full description

Bibliographic Details
Main Author: Oliveira, Tatyana Bitencourt Soares de
Other Authors: Liang, Zhao
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2008
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042008-142253/
id ndltd-usp.br-oai-teses.usp.br-tde-01042008-142253
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-01042008-1422532019-05-09T17:26:12Z Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada Data clustering based on complex network community detection Oliveira, Tatyana Bitencourt Soares de Bio-inspired computing Clusterização de dados Complex network Computação bioinspirada Data clustering Redes complexas A Clusterização de dados em grupos oferece uma maneira de entender e extrair informações relevantes de grandes conjuntos de dados. A abordagem em relação a aspectos como a representação dos dados e medida de similaridade entre clusters, e a necessidade de ajuste de parâmetros iniciais são as principais diferenças entre os algoritmos de clusterização, influenciando na qualidade da divisão dos clusters. O uso cada vez mais comum de grandes conjuntos de dados aliado à possibilidade de melhoria das técnicas já existentes tornam a clusterização de dados uma área de pesquisa que permite inovações em diferentes campos. Nesse trabalho é feita uma revisão dos métodos de clusterização já existentes, e é descrito um novo método de clusterização de dados baseado na identificação de comunidades em redes complexas e modelos computacionais inspirados biologicamente. A técnica de clusterização proposta é composta por duas etapas: formação da rede usando os dados de entrada; e particionamento dessa rede para obtenção dos clusters. Nessa última etapa, a técnica de otimização por nuvens de partículas é utilizada a fim de identificar os clusters na rede, resultando em um algoritmo de clusterização hierárquico divisivo. Resultados experimentais revelaram como características do método proposto a capacidade de detecção de clusters de formas arbitrárias e a representação de clusters com diferentes níveis de refinamento. DAta clustering is an important technique to understand and to extract relevant information in large datasets. Data representation and similarity measure adopted, and the need to adjust initial parameters, are the main differences among clustering algorithms, interfering on clusters quality. The crescent use of large datasets and the possibility to improve existing techniques make data clustering a research area that allows innovation in different fields. In this work is made a review of existing data clustering methods, and it is proposed a new data clustering technique based on community dectection on complex networks and bioinspired models. The proposed technique is composed by two steps: network formation to represent input data; and network partitioning to identify clusters. In the last step, particle swarm optimization technique is used to detect clusters, resulting in an hierarchical clustering algorithm. Experimental results reveal two main features of the algorithm: the ability to detect clusters in arbitrary shapes and the ability to generate clusters with different refinement degrees Biblioteca Digitais de Teses e Dissertações da USP Liang, Zhao 2008-02-25 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042008-142253/ pt Liberar o conteúdo para acesso público.
collection NDLTD
language pt
format Others
sources NDLTD
topic Bio-inspired computing
Clusterização de dados
Complex network
Computação bioinspirada
Data clustering
Redes complexas
spellingShingle Bio-inspired computing
Clusterização de dados
Complex network
Computação bioinspirada
Data clustering
Redes complexas
Oliveira, Tatyana Bitencourt Soares de
Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
description A Clusterização de dados em grupos oferece uma maneira de entender e extrair informações relevantes de grandes conjuntos de dados. A abordagem em relação a aspectos como a representação dos dados e medida de similaridade entre clusters, e a necessidade de ajuste de parâmetros iniciais são as principais diferenças entre os algoritmos de clusterização, influenciando na qualidade da divisão dos clusters. O uso cada vez mais comum de grandes conjuntos de dados aliado à possibilidade de melhoria das técnicas já existentes tornam a clusterização de dados uma área de pesquisa que permite inovações em diferentes campos. Nesse trabalho é feita uma revisão dos métodos de clusterização já existentes, e é descrito um novo método de clusterização de dados baseado na identificação de comunidades em redes complexas e modelos computacionais inspirados biologicamente. A técnica de clusterização proposta é composta por duas etapas: formação da rede usando os dados de entrada; e particionamento dessa rede para obtenção dos clusters. Nessa última etapa, a técnica de otimização por nuvens de partículas é utilizada a fim de identificar os clusters na rede, resultando em um algoritmo de clusterização hierárquico divisivo. Resultados experimentais revelaram como características do método proposto a capacidade de detecção de clusters de formas arbitrárias e a representação de clusters com diferentes níveis de refinamento. === DAta clustering is an important technique to understand and to extract relevant information in large datasets. Data representation and similarity measure adopted, and the need to adjust initial parameters, are the main differences among clustering algorithms, interfering on clusters quality. The crescent use of large datasets and the possibility to improve existing techniques make data clustering a research area that allows innovation in different fields. In this work is made a review of existing data clustering methods, and it is proposed a new data clustering technique based on community dectection on complex networks and bioinspired models. The proposed technique is composed by two steps: network formation to represent input data; and network partitioning to identify clusters. In the last step, particle swarm optimization technique is used to detect clusters, resulting in an hierarchical clustering algorithm. Experimental results reveal two main features of the algorithm: the ability to detect clusters in arbitrary shapes and the ability to generate clusters with different refinement degrees
author2 Liang, Zhao
author_facet Liang, Zhao
Oliveira, Tatyana Bitencourt Soares de
author Oliveira, Tatyana Bitencourt Soares de
author_sort Oliveira, Tatyana Bitencourt Soares de
title Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
title_short Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
title_full Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
title_fullStr Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
title_full_unstemmed Clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
title_sort clusterização de dados utilizando técnicas de redes complexas e computação bioinspirada
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2008
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042008-142253/
work_keys_str_mv AT oliveiratatyanabitencourtsoaresde clusterizacaodedadosutilizandotecnicasderedescomplexasecomputacaobioinspirada
AT oliveiratatyanabitencourtsoaresde dataclusteringbasedoncomplexnetworkcommunitydetection
_version_ 1719047959260168192