Advanced techniques for graph analysis: a multimodal approach over planetary-scale data

Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems w...

Full description

Bibliographic Details
Main Author: Gabriel Perri Gimenes
Other Authors: José Fernando Rodrigues Junior
Language:English
Published: Universidade de São Paulo 2015
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-26062015-105026/
id ndltd-IBICT-oai-teses.usp.br-tde-26062015-105026
record_format oai_dc
spelling ndltd-IBICT-oai-teses.usp.br-tde-26062015-1050262019-01-21T22:10:08Z Advanced techniques for graph analysis: a multimodal approach over planetary-scale data Técnicas avançadas de análise de grafos: uma abordagem multimodal sobre dados em escala planetária Gabriel Perri Gimenes José Fernando Rodrigues Junior Sandra Aparecida de Amo Marcos Gonçalves Quiles Francisco Aparecido Rodrigues Análise de dados Banco de dados Grafos Processamento paralelo assincrono Asynchronous parallel processing Data analysis Databases Graphs Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems when the task is to use their data to support decision making processes by means of non-obvious and potentially useful patterns. In order to process such data for pattern discover, researchers and practitioners have used distributed processing resources organized in computational clusters. However, building and managing such clusters can be complex, bringing technical and financial issues that can be prohibitive in a variety of scenarios. Alternatively, it is desirable to process large scale graphs using only one computational node. To do so, we developed processes and algorithms according to three different approaches, building up towards an analytical set capable of revealing patterns, comprehension, and to help with the decision making process over planetary-scale graphs. Aplicações como comércio eletrônico, redes de computadores, redes sociais e biologia (interação proteica), entre outras, levaram a produção de dados que podem ser representados como grafos à escala planetária { podendo possuir milhões de nós e bilhões de arestas. Tais aplicações apresentam problemas desafiadores quando a tarefa consiste em usar as informações contidas nos grafos para auxiliar processos de tomada de decisão através da descoberta de padrões não triviais e potencialmente utéis. Para processar esses grafos em busca de padrões, tanto pesquisadores como a indústria tem usado recursos de processamento distribuído organizado em clusters computacionais. Entretanto, a construção e manutenção desses clusters pode ser complexa, trazendo tanto problemas técnicos como financeiros que podem ser proibitivos em diversos casos. Por isso, torna-se desejável a capacidade de se processar grafos em larga escala usando somente um nó computacional. Para isso, foram desenvolvidos processos e algoritmos seguindo três abordagens diferentes, visando a definição de um arcabouço de análise capaz de revelar padrões, compreensão e auxiliar na tomada de decisão sobre grafos em escala planetária. 2015-02-12 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/55/55134/tde-26062015-105026/ eng info:eu-repo/semantics/openAccess Universidade de São Paulo Ciências da Computação e Matemática Computacional USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP
collection NDLTD
language English
sources NDLTD
topic Análise de dados
Banco de dados
Grafos
Processamento paralelo assincrono
Asynchronous parallel processing
Data analysis
Databases
Graphs
spellingShingle Análise de dados
Banco de dados
Grafos
Processamento paralelo assincrono
Asynchronous parallel processing
Data analysis
Databases
Graphs
Gabriel Perri Gimenes
Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
description Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems when the task is to use their data to support decision making processes by means of non-obvious and potentially useful patterns. In order to process such data for pattern discover, researchers and practitioners have used distributed processing resources organized in computational clusters. However, building and managing such clusters can be complex, bringing technical and financial issues that can be prohibitive in a variety of scenarios. Alternatively, it is desirable to process large scale graphs using only one computational node. To do so, we developed processes and algorithms according to three different approaches, building up towards an analytical set capable of revealing patterns, comprehension, and to help with the decision making process over planetary-scale graphs. === Aplicações como comércio eletrônico, redes de computadores, redes sociais e biologia (interação proteica), entre outras, levaram a produção de dados que podem ser representados como grafos à escala planetária { podendo possuir milhões de nós e bilhões de arestas. Tais aplicações apresentam problemas desafiadores quando a tarefa consiste em usar as informações contidas nos grafos para auxiliar processos de tomada de decisão através da descoberta de padrões não triviais e potencialmente utéis. Para processar esses grafos em busca de padrões, tanto pesquisadores como a indústria tem usado recursos de processamento distribuído organizado em clusters computacionais. Entretanto, a construção e manutenção desses clusters pode ser complexa, trazendo tanto problemas técnicos como financeiros que podem ser proibitivos em diversos casos. Por isso, torna-se desejável a capacidade de se processar grafos em larga escala usando somente um nó computacional. Para isso, foram desenvolvidos processos e algoritmos seguindo três abordagens diferentes, visando a definição de um arcabouço de análise capaz de revelar padrões, compreensão e auxiliar na tomada de decisão sobre grafos em escala planetária.
author2 José Fernando Rodrigues Junior
author_facet José Fernando Rodrigues Junior
Gabriel Perri Gimenes
author Gabriel Perri Gimenes
author_sort Gabriel Perri Gimenes
title Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
title_short Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
title_full Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
title_fullStr Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
title_full_unstemmed Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
title_sort advanced techniques for graph analysis: a multimodal approach over planetary-scale data
publisher Universidade de São Paulo
publishDate 2015
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-26062015-105026/
work_keys_str_mv AT gabrielperrigimenes advancedtechniquesforgraphanalysisamultimodalapproachoverplanetaryscaledata
AT gabrielperrigimenes tecnicasavancadasdeanalisedegrafosumaabordagemmultimodalsobredadosemescalaplanetaria
_version_ 1718891546192904192