Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro

Os estudos de associação de genoma inteiro têm encontrado alguns marcadores associados a doenças notoriamente hereditárias com herança complexa, mas, muitas vezes, estes marcadores somente explicam uma pequena parte da herdabilidade. Este relativo insucesso é atribuído, entre outras causas, à ep...

Full description

Bibliographic Details
Main Author: José Osório de Oliveira Azevedo Neto
Other Authors: Sergio Russo Matioli
Language:Portuguese
Published: Universidade de São Paulo 2013
Subjects:
SNP
Online Access:http://www.teses.usp.br/teses/disponiveis/95/95131/tde-09022014-090547/
id ndltd-IBICT-oai-teses.usp.br-tde-09022014-090547
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic diabetes
doenças genéticas
epistasia
Estudos de associação
GWAS
interação genéticas
marcadores
SNP
association studies
diabetes
epistasis
genetic diseases
genetic interaction
GWAS
markers
SNP
trio
spellingShingle diabetes
doenças genéticas
epistasia
Estudos de associação
GWAS
interação genéticas
marcadores
SNP
association studies
diabetes
epistasis
genetic diseases
genetic interaction
GWAS
markers
SNP
trio
José Osório de Oliveira Azevedo Neto
Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
description Os estudos de associação de genoma inteiro têm encontrado alguns marcadores associados a doenças notoriamente hereditárias com herança complexa, mas, muitas vezes, estes marcadores somente explicam uma pequena parte da herdabilidade. Este relativo insucesso é atribuído, entre outras causas, à epistasia, ou seja, interação entre diferentes locos genéticos. A busca por epistasia é complexa e exige intensos recursos computacionais. Diversos métodos têm sido propostos para abordar este problema, incluindo métodos estatísticos tradicionais, busca estocástica e métodos heurísticos. Poucos destes métodos são capazes de processar as grandes massas de dados produzidas nos estudos caso-controle de genoma inteiro, e ainda menos métodos buscam conjuntos de três ou mais marcadores. A busca exaustiva de conjuntos de marcadores epistáticos é inviável hoje em dia para estes conjuntos, mas o algoritmo BOOST (WAN et al., 2010) mostrou que ela é relativamente fácil para pares de locos, em especial com o uso de placas gráficas como processadores (GPGPU). Partindo deste recente sucesso, propomos um algoritmo em fases para a busca de trios de locos que interagem, utilizando a busca de pares como passo inicial, uma abordagem ainda não utilizada. Outra ideia fundamental do algoritmo proposto é a extensão da concepção de trio de marcadores para um trio de blocos haplotípicos, onde cada bloco é formado por marcadores próximos entre si. Usando os dados do WTCCC, o Troost (de TRio+bOOST) sugeriu trios potencialmente epistáticos em todas a sete doenças. Quando submetidos à confirmação em amostra independente, os trios não puderam ser confirmados, exceto os trios para diabetes tipo 1 (T1D). Duzentos e oito trios foram confirmados para T1D, com baixos valores-P e genótipos combinados de risco com altas razões de chances. Os SNPs que compõem estes trios estão todos na região MHC, sabidamente associada à doença, exceto por um deles que está no cromossomo cinco e não havia sido previamente relacionado à T1D. === Genome-wide association studies have found some markers associated with diseases with complex inheritance. However, these markers explain only a fraction of the previously estimated heritability of the trait. This relative failure has been credited, among other causes, to epistasis, i.e. the interaction among genotypes at different loci. The search for epistasis is complex and requires intense computational resources. Many methods have been proposed to approach this problem, including traditional statistics, stochastic search, and heuristic methods. Few of them are capable of extracting, from the large amount of data produced in genome-wide case-control studies, useful information about sets of markers associated with the trait in question. Exhaustive search of sets of interacting markers is unfeasible nowadays for sets of three or more markers, but the BOOST algorithm (WAN et al., 2010) showed that the search is relatively easy for pairs of SNPs, in particular with the use of graphic cards for general processing (GPGPU). Starting from this recent success, we propose an algorithm in phases for the search for trios of interacting loci, using the search for pairs as the initial step, an approach not tried yet, to our knowledge. Another important idea of our algorithm is the extension of the concept of trio of markers to a trio of haplotypic blocks, where each block is formed by neighbor markers. Using data from WTCCC, the Troost (from TRio+bOOST) algorithm suggested potentially epistatic trios in all seven diseases. When submitted to a confirmation in an independent sample, the results could not be confirmed, except for type-1 diabetes (T1D). Two hundred eight trios were confirmed for T1D, with low p-values and risk combined genotypes with high odds ratio. The SNPs that form those trios are all in the MHC region, which is known to be strongly associated to T1D, except by one SNP in chromosome five that has not been previously associated with T1D.
author2 Sergio Russo Matioli
author_facet Sergio Russo Matioli
José Osório de Oliveira Azevedo Neto
author José Osório de Oliveira Azevedo Neto
author_sort José Osório de Oliveira Azevedo Neto
title Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
title_short Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
title_full Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
title_fullStr Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
title_full_unstemmed Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
title_sort troost - busca de interações entre trios de snps em estudos de associação de genoma inteiro
publisher Universidade de São Paulo
publishDate 2013
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-09022014-090547/
work_keys_str_mv AT joseosoriodeoliveiraazevedoneto troostbuscadeinteracoesentretriosdesnpsemestudosdeassociacaodegenomainteiro
AT joseosoriodeoliveiraazevedoneto troostsearchforinteractionsamongtriosofsnpsingenomewideassociationstudies
_version_ 1718901955538976768
spelling ndltd-IBICT-oai-teses.usp.br-tde-09022014-0905472019-01-21T23:06:59Z Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro Troost Search for interactions among trios of SNPs in genome-wide association studies José Osório de Oliveira Azevedo Neto Sergio Russo Matioli Julia Maria Pavan Soler Helena Paula Brentani Elida Paula Benquique Ojopi Paulo Alberto Otto Carlos Alberto de Braganca Pereira diabetes doenças genéticas epistasia Estudos de associação GWAS interação genéticas marcadores SNP association studies diabetes epistasis genetic diseases genetic interaction GWAS markers SNP trio Os estudos de associação de genoma inteiro têm encontrado alguns marcadores associados a doenças notoriamente hereditárias com herança complexa, mas, muitas vezes, estes marcadores somente explicam uma pequena parte da herdabilidade. Este relativo insucesso é atribuído, entre outras causas, à epistasia, ou seja, interação entre diferentes locos genéticos. A busca por epistasia é complexa e exige intensos recursos computacionais. Diversos métodos têm sido propostos para abordar este problema, incluindo métodos estatísticos tradicionais, busca estocástica e métodos heurísticos. Poucos destes métodos são capazes de processar as grandes massas de dados produzidas nos estudos caso-controle de genoma inteiro, e ainda menos métodos buscam conjuntos de três ou mais marcadores. A busca exaustiva de conjuntos de marcadores epistáticos é inviável hoje em dia para estes conjuntos, mas o algoritmo BOOST (WAN et al., 2010) mostrou que ela é relativamente fácil para pares de locos, em especial com o uso de placas gráficas como processadores (GPGPU). Partindo deste recente sucesso, propomos um algoritmo em fases para a busca de trios de locos que interagem, utilizando a busca de pares como passo inicial, uma abordagem ainda não utilizada. Outra ideia fundamental do algoritmo proposto é a extensão da concepção de trio de marcadores para um trio de blocos haplotípicos, onde cada bloco é formado por marcadores próximos entre si. Usando os dados do WTCCC, o Troost (de TRio+bOOST) sugeriu trios potencialmente epistáticos em todas a sete doenças. Quando submetidos à confirmação em amostra independente, os trios não puderam ser confirmados, exceto os trios para diabetes tipo 1 (T1D). Duzentos e oito trios foram confirmados para T1D, com baixos valores-P e genótipos combinados de risco com altas razões de chances. Os SNPs que compõem estes trios estão todos na região MHC, sabidamente associada à doença, exceto por um deles que está no cromossomo cinco e não havia sido previamente relacionado à T1D. Genome-wide association studies have found some markers associated with diseases with complex inheritance. However, these markers explain only a fraction of the previously estimated heritability of the trait. This relative failure has been credited, among other causes, to epistasis, i.e. the interaction among genotypes at different loci. The search for epistasis is complex and requires intense computational resources. Many methods have been proposed to approach this problem, including traditional statistics, stochastic search, and heuristic methods. Few of them are capable of extracting, from the large amount of data produced in genome-wide case-control studies, useful information about sets of markers associated with the trait in question. Exhaustive search of sets of interacting markers is unfeasible nowadays for sets of three or more markers, but the BOOST algorithm (WAN et al., 2010) showed that the search is relatively easy for pairs of SNPs, in particular with the use of graphic cards for general processing (GPGPU). Starting from this recent success, we propose an algorithm in phases for the search for trios of interacting loci, using the search for pairs as the initial step, an approach not tried yet, to our knowledge. Another important idea of our algorithm is the extension of the concept of trio of markers to a trio of haplotypic blocks, where each block is formed by neighbor markers. Using data from WTCCC, the Troost (from TRio+bOOST) algorithm suggested potentially epistatic trios in all seven diseases. When submitted to a confirmation in an independent sample, the results could not be confirmed, except for type-1 diabetes (T1D). Two hundred eight trios were confirmed for T1D, with low p-values and risk combined genotypes with high odds ratio. The SNPs that form those trios are all in the MHC region, which is known to be strongly associated to T1D, except by one SNP in chromosome five that has not been previously associated with T1D. 2013-11-07 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://www.teses.usp.br/teses/disponiveis/95/95131/tde-09022014-090547/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Bioinformática USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP