Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join
Submitted by Erika Demachki (erikademachki@gmail.com) on 2014-12-29T15:33:04Z No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5) === Approved...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
Universidade Federal de Goiás
2014
|
Subjects: | |
Online Access: | http://repositorio.bc.ufg.br/tede/handle/tede/3836 |
id |
ndltd-IBICT-oai-repositorio.bc.ufg.br-tede-3836 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
topic |
Processamento distribuído Junção espacial Multi-way spatial join R-Tree Distributed processing Spatial join CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
spellingShingle |
Processamento distribuído Junção espacial Multi-way spatial join R-Tree Distributed processing Spatial join CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Cunha, Anderson Rogério Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
description |
Submitted by Erika Demachki (erikademachki@gmail.com) on 2014-12-29T15:33:04Z
No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5) === Approved for entry into archive by Erika Demachki (erikademachki@gmail.com) on 2014-12-29T15:39:23Z (GMT) No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5) === Made available in DSpace on 2014-12-29T15:39:23Z (GMT). No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5)
Previous issue date: 2014-02-19 === Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES === Spatial join is one of the spatial operations of higher computational cost. Its complexity
increases significantly when it involves multiple databases (multi-way spatial join). Traditional
processing strategies of multi-way spatial join apply combinations of binary join
algorithms on centralized computing environments. For complex queries, this approach
requires much computational power, making it often unfeasible in centralized environments.
This work proposes the Distributed Synchronous Traversal algorithm (DST), whose goal
is to enable the distributed processing of multi-way spatial joins on a cluster of computers.
The DST algorithm is based on Synchronous Traversal algorithm and processes the multiway
spatial join in a single synchronous descent upon R-Trees levels of the database
entries (the final outcome is built incrementally, without creating temporary databases).
To the best of our knowledge, there are no other proposals in the literature that deal with
this problem in a distributed fashion and on a peer-to-peer architecture.
Many challenges had to be overcome, such as the definition of data structures that enabled
the mapping of the semantics of queries of multi-way spatial join and coordination of
the required distributed processing. DST proved to be satisfactorily parallelizable and
scalable process real datasets in experiments performed in clusters of 1, 2, 4 and 8 servers. === A junção espacial (Spatial Join) é uma das operações espaciais de maior custo computacional.
Sua complexidade aumenta significativamente quando envolve múltiplas bases de
dados (multi-way spatial join). Estratégias tradicionais de processamento do multi-way
spatial join aplicam combinações de algoritmos de junção binária sobre ambientes computacionais
centralizados. Em consultas complexas, esse tipo de abordagem exige grande
capacidade computacional muitas vezes inviável em ambientes centralizados.
Neste trabalho é proposto o algoritmo Distributed Synchronous Traversal (DST), cujo
objetivo é tornar viável a execução distribuída do multi-way spatial join em um cluster de
computadores. O DST se baseia no algoritmo Synchronous Traversal e processa o multiway
spatial join em uma única descida síncrona sobre os níveis das R-Trees das bases de
dados de entrada. O resultado final é construído incrementalmente, sem a consolidação
de dados intermediários. Até onde conhecemos, não há outras propostas na literatura para
multi-way spatial join distribuído sobre uma arquitetura peer-to-peer.
Muitos desafios tiveram que ser superados, como a definição de estruturas de dados
que possibilitassem o mapeamento da semântica das consultas de multi-way spatial
join e a coordenação do processamento distribuído das mesmas. O DST se mostrou
satisfatoriamente paralelizável e escalável ao processar bases de dados reais em clusters
de até 8 servidores. |
author2 |
Rodrigues, Vagner José do Sacramento |
author_facet |
Rodrigues, Vagner José do Sacramento Cunha, Anderson Rogério |
author |
Cunha, Anderson Rogério |
author_sort |
Cunha, Anderson Rogério |
title |
Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
title_short |
Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
title_full |
Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
title_fullStr |
Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
title_full_unstemmed |
Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
title_sort |
processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join |
publisher |
Universidade Federal de Goiás |
publishDate |
2014 |
url |
http://repositorio.bc.ufg.br/tede/handle/tede/3836 |
work_keys_str_mv |
AT cunhaandersonrogerio processamentodistribuidodajuncaoespacialdemultiplasbasesdedadosmultiwayspatialjoin |
_version_ |
1718894664897003520 |
spelling |
ndltd-IBICT-oai-repositorio.bc.ufg.br-tede-38362019-01-21T22:28:21Z Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join Cunha, Anderson Rogério Rodrigues, Vagner José do Sacramento Rodrigues, Vagner José do Sacramento Davis Júnior, Clodoveu Augusto Cardoso, Kleber Vieira Processamento distribuído Junção espacial Multi-way spatial join R-Tree Distributed processing Spatial join CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Submitted by Erika Demachki (erikademachki@gmail.com) on 2014-12-29T15:33:04Z No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5) Approved for entry into archive by Erika Demachki (erikademachki@gmail.com) on 2014-12-29T15:39:23Z (GMT) No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5) Made available in DSpace on 2014-12-29T15:39:23Z (GMT). No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Dissertação - Anderson Rogério Cunha - 2014.pdf: 4853685 bytes, checksum: d50cf557f1a067a91c2034443ee62df2 (MD5) Previous issue date: 2014-02-19 Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Spatial join is one of the spatial operations of higher computational cost. Its complexity increases significantly when it involves multiple databases (multi-way spatial join). Traditional processing strategies of multi-way spatial join apply combinations of binary join algorithms on centralized computing environments. For complex queries, this approach requires much computational power, making it often unfeasible in centralized environments. This work proposes the Distributed Synchronous Traversal algorithm (DST), whose goal is to enable the distributed processing of multi-way spatial joins on a cluster of computers. The DST algorithm is based on Synchronous Traversal algorithm and processes the multiway spatial join in a single synchronous descent upon R-Trees levels of the database entries (the final outcome is built incrementally, without creating temporary databases). To the best of our knowledge, there are no other proposals in the literature that deal with this problem in a distributed fashion and on a peer-to-peer architecture. Many challenges had to be overcome, such as the definition of data structures that enabled the mapping of the semantics of queries of multi-way spatial join and coordination of the required distributed processing. DST proved to be satisfactorily parallelizable and scalable process real datasets in experiments performed in clusters of 1, 2, 4 and 8 servers. A junção espacial (Spatial Join) é uma das operações espaciais de maior custo computacional. Sua complexidade aumenta significativamente quando envolve múltiplas bases de dados (multi-way spatial join). Estratégias tradicionais de processamento do multi-way spatial join aplicam combinações de algoritmos de junção binária sobre ambientes computacionais centralizados. Em consultas complexas, esse tipo de abordagem exige grande capacidade computacional muitas vezes inviável em ambientes centralizados. Neste trabalho é proposto o algoritmo Distributed Synchronous Traversal (DST), cujo objetivo é tornar viável a execução distribuída do multi-way spatial join em um cluster de computadores. O DST se baseia no algoritmo Synchronous Traversal e processa o multiway spatial join em uma única descida síncrona sobre os níveis das R-Trees das bases de dados de entrada. O resultado final é construído incrementalmente, sem a consolidação de dados intermediários. Até onde conhecemos, não há outras propostas na literatura para multi-way spatial join distribuído sobre uma arquitetura peer-to-peer. Muitos desafios tiveram que ser superados, como a definição de estruturas de dados que possibilitassem o mapeamento da semântica das consultas de multi-way spatial join e a coordenação do processamento distribuído das mesmas. O DST se mostrou satisfatoriamente paralelizável e escalável ao processar bases de dados reais em clusters de até 8 servidores. 2014-12-29T15:39:23Z 2014-02-19 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis CUNHA, Anderson Rogério. Processamento distribuído da junção espacial de múltiplas bases de dados: multi-way spatial join. 2014. 82 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2014. http://repositorio.bc.ufg.br/tede/handle/tede/3836 por -3303550325223384799 600 600 600 600 -7712266734633644768 8930092515683771531 2075167498588264571 info:eu-repo/semantics/openAccess application/pdf Universidade Federal de Goiás Programa de Pós-graduação em Ciência da Computação (INF) UFG Brasil Instituto de Informática - INF (RG) reponame:Biblioteca Digital de Teses e Dissertações da UFG instname:Universidade Federal de Goiás instacron:UFG |