Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública

Submitted by Santos Davilene (davilenes@ufba.br) on 2016-05-30T15:55:34Z No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5) === Made available in DSpace on 2016-05-30T15:55:34Z (GMT). No. of bitstreams: 1 Dissertação_Mestrado_...

Full description

Bibliographic Details
Main Author: Pinto, Clícia dos Santos
Other Authors: Boratto, Murilo do Carmo
Language:Portuguese
Published: Instituto de Matemática. Departamento de Ciência da Computação 2016
Subjects:
ETL
Online Access:http://repositorio.ufba.br/ri/handle/ri/19307
id ndltd-IBICT-oai-192.168.11-11-ri-19307
record_format oai_dc
spelling ndltd-IBICT-oai-192.168.11-11-ri-193072018-10-07T07:43:40Z Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública Pinto, Clícia dos Santos Boratto, Murilo do Carmo Santos, Carlos Antonio de Souza Teles Durão, Frederico Araujo Ciência da Computação Big Data ETL pré-processamento correlação de registros Spark Submitted by Santos Davilene (davilenes@ufba.br) on 2016-05-30T15:55:34Z No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5) Made available in DSpace on 2016-05-30T15:55:34Z (GMT). No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5) Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil. 2016-05-30T15:55:34Z 2016-05-30T15:55:34Z 2016-05-30 2015-03-05 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://repositorio.ufba.br/ri/handle/ri/19307 por info:eu-repo/semantics/openAccess Instituto de Matemática. Departamento de Ciência da Computação Mestrado Multiinstitucional em Ciência da Computação UFBA Brasil reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia instacron:UFBA
collection NDLTD
language Portuguese
sources NDLTD
topic Ciência da Computação
Big Data
ETL
pré-processamento
correlação de registros
Spark
spellingShingle Ciência da Computação
Big Data
ETL
pré-processamento
correlação de registros
Spark
Pinto, Clícia dos Santos
Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
description Submitted by Santos Davilene (davilenes@ufba.br) on 2016-05-30T15:55:34Z No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5) === Made available in DSpace on 2016-05-30T15:55:34Z (GMT). No. of bitstreams: 1 Dissertação_Mestrado_Clicia(1).pdf: 2228201 bytes, checksum: d990a114eac5a988c57ba6d1e22e8f99 (MD5) === Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil.
author2 Boratto, Murilo do Carmo
author_facet Boratto, Murilo do Carmo
Pinto, Clícia dos Santos
author Pinto, Clícia dos Santos
author_sort Pinto, Clícia dos Santos
title Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
title_short Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
title_full Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
title_fullStr Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
title_full_unstemmed Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
title_sort aplicação de etl para a integração de dados com ênfase em big data na área de saúde pública
publisher Instituto de Matemática. Departamento de Ciência da Computação
publishDate 2016
url http://repositorio.ufba.br/ri/handle/ri/19307
work_keys_str_mv AT pintocliciadossantos aplicacaodeetlparaaintegracaodedadoscomenfaseembigdatanaareadesaudepublica
_version_ 1718770353066475520