Divergenome: uma plataforma bioinformática para o estudo da diversidade genética humana e aplicações na identificação de episódios de seleção natural na evolução humana

=== At this work we developed a management platform for data and projects from population genetics and genetic epidemiology fields called DIVERGENOME. It is composed of two functional components: A) a relational database, which aims to safely store, organize and integrate different sources of infor...

Full description

Bibliographic Details
Main Author: Wagner Carlos Santos Magalhaes
Other Authors: Eduardo Martin Tarazona Santos
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2011
Online Access:http://hdl.handle.net/1843/BUOS-9TDGLR
Description
Summary:=== At this work we developed a management platform for data and projects from population genetics and genetic epidemiology fields called DIVERGENOME. It is composed of two functional components: A) a relational database, which aims to safely store, organize and integrate different sources of information and datasets (available at public repositories and locally produced), as well as genetic data (genotypes and haplotypes inferred using different types of polymorphisms) and epidemiologic information (phenotypes, characterized by quantitative and qualitative variables); and B) a set of scripts written using the programming language Perl, called DIVERGENOMEtools, that enables users to handle and change file formats according to their and software required for data analysis, a step which bears several basic but error-prone tasks. Our conversion tool outlines a new strategy, graph based, that integrates the scripts available by creating dynamic conversion pipelines attempting to maximize the number of formats available and to easy incorporate new scripts to the system. A first version of DIVERGENOMEtools may be accessed at (www.cebio.org/pipelineldgh/). The different modules of our platform demonstrated to be efficient to their objective. Finally, we developed a web interface to make easy the access of all functionalities of our system. === Neste trabalho desenvolvemos uma plataforma de gerenciamento de dados e projetos, provenientes de estudos de genética de populações e epidemiologia genética, a DIVERGENOME. A plataforma apresenta dois componentes funcionais: A) uma base de dados relacional, o DIVERGENOMEdb, desenvolvida com o objetivo de armazenar os dados de forma segura e organizada e integrar diferentes fontes de informação (disponíveis em repositórios públicos e gerados localmente), dados genéticos (genótipos e haplótipos, provenientes de diferentes tipos de polimorfismos) e informações epidemiológicas (fenótipos, constituídos de variáveis qualitativas e quantitativas); e B) um conjunto de scripts para manipulação de formatos de arquivos, o DIVERGENOMEtools, com o objetivo de otimizar a tarefa de conversão de formatos para análises em diferentes software, tarefa comprovadamente árdua e fonte de grande número de erros evidenciados nos resultados finais das análises. Nossa plataforma apresenta uma nova metodologia para a integração de diferentes scripts permitindo maior número possível de conversões e fácilitando sua extensão. Uma primeira versão da ferramenta pode ser acessada em (www.cebio.org/pipelineldgh/). Os diferentes componentes da plataforma foram utilizados na condução dos trabalhos sobre a ação dos fatores evolutivos que moldam a diversidade genética apresentados na dissertação, mostrando-se eficientes às suas propostas. Para garantir a o acesso de forma rápida e ampla utilização de nossa plataforma pela comunidade científica desenvolvemos ainda uma interface web dessa forma não exigindo do usuário conhecimentos prévios de programação e gerenciamento de bancos de dados.