Summary: | É o processo de mutação que, em última instância, introduz diversidade nas populações. Quando a mutação é pontual e segrega na população, recebe o nome de polimorfismo de nucleotídeo único (ou SNP, de Single Nucleotide Polymorphism). Caso esse SNP seja vantajoso, ele aumenta de frequência na população e estabelece um forte desequilíbrio de ligação com seus SNPs vizinhos, consequência do processo chamado de efeito de carona genética. Esse efeito pode ter duas consequências na proximidade dos sítios selecionados: (1) pode levar ao aumento de frequência de mutações neutras ligadas a mutação vantajosa ou (2) pode reduzir o tamanho efetivo da população Ne nessas regiões, e, consequentemente aumentar a importância da deriva genética na variação genética dessas regiões. Como consequência, é comum que a região próxima a sítios vantajosos apresente acúmulo de mutações neutras com frequências acima do esperado sob neutralidade. No entanto, a maior parte de novas mutações são deletérias e seria esperado que fossem removidas da população por seleção purificadora. Entretanto, como os padrões de variabilidade observados no genoma resultam de processos seletivos atuando em conjunto com a deriva genética, não é incomum SNPs fracamente deletérios atingirem frequências elevadas nos diferentes contextos de história demográfica e seletiva das populações. O acúmulo desses SNPs fracamente deletérios no genoma reduz progressivamente a aptidão média da população, o que representa um aumento de sua carga genética. Neste estudo investigamos se na vizinhança de sítios vantajosos selecionados há um acúmulo de SNPs deletérios, contribuindo para a carga genética da população. Para responder essa questão, dividimos nosso estudo em três passos. Primeiro, desenvolvemos uma nova metodologia para estimar a diferença na carga genética entre região vizinha a sítios selecionados e o resto do genoma. Nossa metodologia é mais robusta do que a tradicionalmente utilizada pois garante que a região influenciada pela seleção natural e o controle apresentem o mesmo número de SNPs, e possibilita controlar para variáveis confundidoras, como a frequência dos polimorfismos, permitindo explorar regiões alvo com diferentes características e reduzir resultados espúrios. Em seguida, utilizamos nossa metodologia para testar se a carga genética na região vizinha a sítios sob seleção positiva é maior do que no restante do genoma. Identificamos um acúmulo de SNPs deletérios em europeus e leste asiáticos para amostras do projeto 1000 genomas.Mostramos também que as mesmas regiões exploradas em populações sob efeito de seleção positiva não apresentaram carga genética aumentada em populações nas quais essas regiões não experimentaram seleção positiva. Por último, utilizamos essa mesma metodologia para avaliar a carga genética em genes sob seleção balanceadora, os genes clássicos do HLA de classe I. Esses genes compõe uma das famílias gênicas mais estudadas em humanos e para os quais existem evidências indicando os sítios específicos que estão sob seleção balanceadora. Nosso teste mostrou que as regiões vizinhas aos sítios sob seleção balanceadora dentro dos genes do HLA apresentam acúmulo de SNPs deletérios para pelo menos dois agrupamentos populacionais. Assim, com os três passos aqui descritos, conseguimos apontar o aumento da carga genética em regiões próximas a sítios sob dois regimes de seleção distintos, utilizando uma metodologia capaz de considerar características específicas das regiões estudadas === It is the mutation process that ultimately introduces diversity into populations. When a mutation is punctual and segregates in the population, it is called a single nucleotide polymorphism (SNP). If this mutation is advantageous, it increases in frequency in the population and creates strong linkage disequilibrium with its neighboring loci, as a consequence of the hitchhiking effect. This effect can have two consequences in the vicinity of the selected sites: (1) it can increase the frequency of neutral mutations linked to this advantageous mutation or (2) can reduce the effective population size Ne in the region around the selected site, and consequently increase the importance of genetic drift in the genetic variation of these regions. As a consequence, it is common that the region around sites under advantageous selection to accumulate more neutral mutations at high frequencies than expected under neutrality. However, most new mutation are deleterious and it is expected that these mutation will be removed from the population by purifying selection. However, since the patterns of variability observed in the genome result from selective processes interacting with genetic drift, it is common for weakly deleterious SNPs to reach high frequencies in different population demographic histories. The accumulation of these weakly deleterious SNPs in the genome progressively reduces the population\'s fitness, increasing their genetic load. In this study we investigated whether in the neighborhood of selected sites there is an accumulation of deleterious SNPs due to hitchhiking, contributing to the genetic load of the population. To answer this question, we divided our study into three steps. First, we developed a new methodology to estimate the genetic load difference between the region around selected sites and the rest of the genome. Our methodology is more robust than those traditionally used one because it ensures that both the region influenced by natural selection and control have the same number of SNPs, reducing the probability of spurious results, and is flexible to different genome peculiarities, making it possible to explore target regions with different characteristics. We then used our methodology to test whether genetic load in the region around sites under positive selection is greater than in the rest of the genome. We found consistent evidence of an accumulation of deleterious SNPs in European and East Asian continental groups. We also showed that these same region do not present the same deleterious SNP accumulation in populations in which these region did not experience positive selection. Finally, we used this same methodology to evaluate the genetic load in genes under the balancing selection, the classic HLA class I genes. These genes are one of the most studied in humans and there is evidence that indicates the specific sites within these genes that are under balancing selection. We found that the regions around these sites under balancing selection within the HLA genes had deleterious SNPs accumulating for at least two continental groups. Thus, with the three steps described here, we were able to point out the increase of genetic load in regions around selected sites for two distinct selective regimes using a methodology that takes into account specific characteristics of the studied regions
|