Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems w...
Main Author: | |
---|---|
Other Authors: | |
Language: | English |
Published: |
Universidade de São Paulo
2015
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-26062015-105026/ |
id |
ndltd-IBICT-oai-teses.usp.br-tde-26062015-105026 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-teses.usp.br-tde-26062015-1050262019-01-21T22:10:08Z Advanced techniques for graph analysis: a multimodal approach over planetary-scale data Técnicas avançadas de análise de grafos: uma abordagem multimodal sobre dados em escala planetária Gabriel Perri Gimenes José Fernando Rodrigues Junior Sandra Aparecida de Amo Marcos Gonçalves Quiles Francisco Aparecido Rodrigues Análise de dados Banco de dados Grafos Processamento paralelo assincrono Asynchronous parallel processing Data analysis Databases Graphs Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems when the task is to use their data to support decision making processes by means of non-obvious and potentially useful patterns. In order to process such data for pattern discover, researchers and practitioners have used distributed processing resources organized in computational clusters. However, building and managing such clusters can be complex, bringing technical and financial issues that can be prohibitive in a variety of scenarios. Alternatively, it is desirable to process large scale graphs using only one computational node. To do so, we developed processes and algorithms according to three different approaches, building up towards an analytical set capable of revealing patterns, comprehension, and to help with the decision making process over planetary-scale graphs. Aplicações como comércio eletrônico, redes de computadores, redes sociais e biologia (interação proteica), entre outras, levaram a produção de dados que podem ser representados como grafos à escala planetária { podendo possuir milhões de nós e bilhões de arestas. Tais aplicações apresentam problemas desafiadores quando a tarefa consiste em usar as informações contidas nos grafos para auxiliar processos de tomada de decisão através da descoberta de padrões não triviais e potencialmente utéis. Para processar esses grafos em busca de padrões, tanto pesquisadores como a indústria tem usado recursos de processamento distribuído organizado em clusters computacionais. Entretanto, a construção e manutenção desses clusters pode ser complexa, trazendo tanto problemas técnicos como financeiros que podem ser proibitivos em diversos casos. Por isso, torna-se desejável a capacidade de se processar grafos em larga escala usando somente um nó computacional. Para isso, foram desenvolvidos processos e algoritmos seguindo três abordagens diferentes, visando a definição de um arcabouço de análise capaz de revelar padrões, compreensão e auxiliar na tomada de decisão sobre grafos em escala planetária. 2015-02-12 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/55/55134/tde-26062015-105026/ eng info:eu-repo/semantics/openAccess Universidade de São Paulo Ciências da Computação e Matemática Computacional USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP |
collection |
NDLTD |
language |
English |
sources |
NDLTD |
topic |
Análise de dados
Banco de dados Grafos Processamento paralelo assincrono Asynchronous parallel processing Data analysis Databases Graphs |
spellingShingle |
Análise de dados
Banco de dados Grafos Processamento paralelo assincrono Asynchronous parallel processing Data analysis Databases Graphs Gabriel Perri Gimenes Advanced techniques for graph analysis: a multimodal approach over planetary-scale data |
description |
Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems when the task is to use their data to support decision making processes by means of non-obvious and potentially useful patterns. In order to process such data for pattern discover, researchers and practitioners have used distributed processing resources organized in computational clusters. However, building and managing such clusters can be complex, bringing technical and financial issues that can be prohibitive in a variety of scenarios. Alternatively, it is desirable to process large scale graphs using only one computational node. To do so, we developed processes and algorithms according to three different approaches, building up towards an analytical set capable of revealing patterns, comprehension, and to help with the decision making process over planetary-scale graphs.
===
Aplicações como comércio eletrônico, redes de computadores, redes sociais e biologia (interação proteica), entre outras, levaram a produção de dados que podem ser representados como grafos à escala planetária { podendo possuir milhões de nós e bilhões de arestas. Tais aplicações apresentam problemas desafiadores quando a tarefa consiste em usar as informações contidas nos grafos para auxiliar processos de tomada de decisão através da descoberta de padrões não triviais e potencialmente utéis. Para processar esses grafos em busca de padrões, tanto pesquisadores como a indústria tem usado recursos de processamento distribuído organizado em clusters computacionais. Entretanto, a construção e manutenção desses clusters pode ser complexa, trazendo tanto problemas técnicos como financeiros que podem ser proibitivos em diversos casos. Por isso, torna-se desejável a capacidade de se processar grafos em larga escala usando somente um nó computacional. Para isso, foram desenvolvidos processos e algoritmos seguindo três abordagens diferentes, visando a definição de um arcabouço de análise capaz de revelar padrões, compreensão e auxiliar na tomada de decisão sobre grafos em escala planetária.
|
author2 |
José Fernando Rodrigues Junior |
author_facet |
José Fernando Rodrigues Junior Gabriel Perri Gimenes |
author |
Gabriel Perri Gimenes |
author_sort |
Gabriel Perri Gimenes |
title |
Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
|
title_short |
Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
|
title_full |
Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
|
title_fullStr |
Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
|
title_full_unstemmed |
Advanced techniques for graph analysis: a multimodal approach over planetary-scale data
|
title_sort |
advanced techniques for graph analysis: a multimodal approach over planetary-scale data |
publisher |
Universidade de São Paulo |
publishDate |
2015 |
url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-26062015-105026/ |
work_keys_str_mv |
AT gabrielperrigimenes advancedtechniquesforgraphanalysisamultimodalapproachoverplanetaryscaledata AT gabrielperrigimenes tecnicasavancadasdeanalisedegrafosumaabordagemmultimodalsobredadosemescalaplanetaria |
_version_ |
1718891546192904192 |