Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão

In recent years there has been much focus on the use of single nucleotide polymorphism (SNP) fine genome mapping to identify causative mutations for traits of interest; however, many studies focus only on the marginal effects of markers, ignoring potential gene interactions. Simulation studies have...

Full description

Bibliographic Details
Main Authors: Romdhane Rekaya, Kelly Robbins
Format: Article
Language:English
Published: Sociedade Brasileira de Zootecnia 2009-07-01
Series:Revista Brasileira de Zootecnia
Subjects:
SNP
Online Access:http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1516-35982009001300011
id doaj-b7ee62cb3dd949049ad4cd97df1b7b01
record_format Article
spelling doaj-b7ee62cb3dd949049ad4cd97df1b7b012020-11-24T22:18:12ZengSociedade Brasileira de ZootecniaRevista Brasileira de Zootecnia1516-35981806-92902009-07-0138spe939710.1590/S1516-35982009001300011Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensãoRomdhane RekayaKelly RobbinsIn recent years there has been much focus on the use of single nucleotide polymorphism (SNP) fine genome mapping to identify causative mutations for traits of interest; however, many studies focus only on the marginal effects of markers, ignoring potential gene interactions. Simulation studies have show that this approach may not be powerful enough to detect important loci when gene interactions are present. While several studies have examined potential gene interaction, they tend to focus on a small number of SNP markers. Given the prohibitive computation cost of modeling interactions in studies involving a large number SNP, methods need to be develop that can account for potential gene interactions in a computationally efficient manner. This study adopts a machine learning approach by adapting the ant colony optimization algorithm (ACA), coupled with logistic regression on haplotypes and genotypes, for association studies involving large numbers of SNP markers. The proposed method is compared to haplotype analysis, implemented using a sliding window (SW/H), and single locus genotype association (RG). Each algorithm was evaluated using a binary trait simulated using an epistatic model and HapMap ENCODE genotype data. Results show that the ACA outperformed SW/H and RG under all simulation scenarios, yielding substantial increases in power to detect genomic regions associated with the simulated trait.<br>Nos últimos anos muita atenção tem sido dada ao uso de polimorfismos de nucleotídeos simples (SNP) para mapeamento fino do genoma, visando identificar mutações efetivas em características de interesse; todavia, muitos estudos focam apenas os efeitos marginais dos marcadores, ignorando as potenciais interações entre genes. Estudos de simulação tem mostrado que esta abordagem pode não ser poderosa o suficiente para detectar loci importantes quando interações entre genes estão presentes. Vários estudos tem examinado potenciais interações gênicas, porém focando um pequeno número de marcadores SNP. Devido ao proibitivo custo computacional para modelar interações em estudos envolvendo um grande número de SNP's, precisam ser desenvolvidos métodos que considerem potenciais interações gênicas, de uma forma computacionalmente eficiente. Este estudo adota a abordagem de um mecanismo de aprendizagem, adaptando o algoritmo de otimização colônia de formigas (ACA), combinado com regressão logística em função dos haplótipos e genótipos, para estudos de associação envolvendo grande número de marcadores SNP. O método proposto é comparado à análise de haplótipos, implementado usando uma janela deslizante (SW/H), e a associação de genótipos de lócus único (RG). Cada algoritmo foi avaliado usando uma característica binária simulada usando um modelo epistático e dados genotípicos do HapMap ENCODE. Os resultados mostram que o ACA superou o SW/H e RG em todos os cenários de simulação, produzindo aumentos substanciais no poder de detectar regiões genômicas associadas com características simuladas.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1516-35982009001300011genomasimulaçãoSNPgenomesimulationSNP
collection DOAJ
language English
format Article
sources DOAJ
author Romdhane Rekaya
Kelly Robbins
spellingShingle Romdhane Rekaya
Kelly Robbins
Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
Revista Brasileira de Zootecnia
genoma
simulação
SNP
genome
simulation
SNP
author_facet Romdhane Rekaya
Kelly Robbins
author_sort Romdhane Rekaya
title Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
title_short Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
title_full Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
title_fullStr Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
title_full_unstemmed Ant colony algorithm for analysis of gene interaction in high-dimensional association data Algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
title_sort ant colony algorithm for analysis of gene interaction in high-dimensional association data algoritmo colônia de formigas para análise de interação gênica em dados de associação de alta dimensão
publisher Sociedade Brasileira de Zootecnia
series Revista Brasileira de Zootecnia
issn 1516-3598
1806-9290
publishDate 2009-07-01
description In recent years there has been much focus on the use of single nucleotide polymorphism (SNP) fine genome mapping to identify causative mutations for traits of interest; however, many studies focus only on the marginal effects of markers, ignoring potential gene interactions. Simulation studies have show that this approach may not be powerful enough to detect important loci when gene interactions are present. While several studies have examined potential gene interaction, they tend to focus on a small number of SNP markers. Given the prohibitive computation cost of modeling interactions in studies involving a large number SNP, methods need to be develop that can account for potential gene interactions in a computationally efficient manner. This study adopts a machine learning approach by adapting the ant colony optimization algorithm (ACA), coupled with logistic regression on haplotypes and genotypes, for association studies involving large numbers of SNP markers. The proposed method is compared to haplotype analysis, implemented using a sliding window (SW/H), and single locus genotype association (RG). Each algorithm was evaluated using a binary trait simulated using an epistatic model and HapMap ENCODE genotype data. Results show that the ACA outperformed SW/H and RG under all simulation scenarios, yielding substantial increases in power to detect genomic regions associated with the simulated trait.<br>Nos últimos anos muita atenção tem sido dada ao uso de polimorfismos de nucleotídeos simples (SNP) para mapeamento fino do genoma, visando identificar mutações efetivas em características de interesse; todavia, muitos estudos focam apenas os efeitos marginais dos marcadores, ignorando as potenciais interações entre genes. Estudos de simulação tem mostrado que esta abordagem pode não ser poderosa o suficiente para detectar loci importantes quando interações entre genes estão presentes. Vários estudos tem examinado potenciais interações gênicas, porém focando um pequeno número de marcadores SNP. Devido ao proibitivo custo computacional para modelar interações em estudos envolvendo um grande número de SNP's, precisam ser desenvolvidos métodos que considerem potenciais interações gênicas, de uma forma computacionalmente eficiente. Este estudo adota a abordagem de um mecanismo de aprendizagem, adaptando o algoritmo de otimização colônia de formigas (ACA), combinado com regressão logística em função dos haplótipos e genótipos, para estudos de associação envolvendo grande número de marcadores SNP. O método proposto é comparado à análise de haplótipos, implementado usando uma janela deslizante (SW/H), e a associação de genótipos de lócus único (RG). Cada algoritmo foi avaliado usando uma característica binária simulada usando um modelo epistático e dados genotípicos do HapMap ENCODE. Os resultados mostram que o ACA superou o SW/H e RG em todos os cenários de simulação, produzindo aumentos substanciais no poder de detectar regiões genômicas associadas com características simuladas.
topic genoma
simulação
SNP
genome
simulation
SNP
url http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1516-35982009001300011
work_keys_str_mv AT romdhanerekaya antcolonyalgorithmforanalysisofgeneinteractioninhighdimensionalassociationdataalgoritmocoloniadeformigasparaanalisedeinteracaogenicaemdadosdeassociacaodealtadimensao
AT kellyrobbins antcolonyalgorithmforanalysisofgeneinteractioninhighdimensionalassociationdataalgoritmocoloniadeformigasparaanalisedeinteracaogenicaemdadosdeassociacaodealtadimensao
_version_ 1725782826515693568