Evolution of gene repertoires and new genes in yeasts
Les répertoires de gènes sont des objets extrêmement dynamiques : Des gènes sont dupliqués et perdus, transférés d’un génome à l’autre et des nouveaux gènes sont créés. L’étude de ces processus et de leur impact sur l’évolution des répertoires de gènes est fondamentale pour notre compréhension de l’...
Main Author: | |
---|---|
Other Authors: | |
Language: | en |
Published: |
2016
|
Subjects: | |
Online Access: | http://www.theses.fr/2016PA066342 |
id |
ndltd-theses.fr-2016PA066342 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
en |
sources |
NDLTD |
topic |
Nouveaux gènes Répertoire de gènes Génomique comparative Evolution Levures Gènes de novo De novo genes Comparative genomics Gene repertoires 570 |
spellingShingle |
Nouveaux gènes Répertoire de gènes Génomique comparative Evolution Levures Gènes de novo De novo genes Comparative genomics Gene repertoires 570 Vakirlis, Nikolaos Evolution of gene repertoires and new genes in yeasts |
description |
Les répertoires de gènes sont des objets extrêmement dynamiques : Des gènes sont dupliqués et perdus, transférés d’un génome à l’autre et des nouveaux gènes sont créés. L’étude de ces processus et de leur impact sur l’évolution des répertoires de gènes est fondamentale pour notre compréhension de l’énorme diversité de la vie sur terre. J’ai reconstruit les familles des gènes homologues chez les levures du clade Lachancea et je les ai classées en trois catégories selon leur présence chez les espèces en dehors du clade en: transmises verticalement (98.2 %), transmises horizontalement (0.15 %) et spécifiques aux Lachancea (1.63 %). Ensuite, j’ai reconstruit l’évolution de chaque famille de gènes le long de l’arbre phylogénétique des Lachancea en terme de gains et de pertes depuis l’origine du clade. Mes résultats suggèrent que les réarrangements chromosomiques balancés (translocations, inversions) peuvent interrompre, au niveau de leurs points de cassure, la séquence codante des gènes, et entraîner jusqu’à 14 % des pertes de gènes observées (rupture de gène). En outre, j’ai observé des corrélations entre le taux de divergence des séquences codant pour des protéines et les taux de duplication de gènes, de translocations et d’inversions, et de rupture de gène, suggérant l’existence d’une horloge génomique qui coordonnerait ces processus. Par la suite, je me suis focalisé sur l’émergence de nouveaux gènes de novo à partir de séquences non-codantes, dont l’impact global sur les génomes n’est pas encore connu. J’ai pour cela analysé les gènes taxonomiquement restreints aux levures des clades Lachancea et Saccharomyces sensu stricto et j’ai pu identifier un ensemble de 596 gènes ayant fort probablement émergé de novo. Le taux d’émergence de novo est constant chez les levures au sein du même clade mais varie d’un ordre de grandeur entre les 2 clades (2.8 gènes/ma chez les Saccharomyces et 0.27 gènes/ma chez les Lachancea). Ces nouveaux gènes sont distribués uniformément sur les chromosomes. Ils sont le plus souvent orientés de façon divergente par rapport à leur voisin en 5’, ce qui suggère que leur transcription pourrait être initiée au niveau de promoteurs divergents, favorisant ainsi la transition d’une séquence intergénique non transcrite à une séquence codante transcrite (puis traduite). Enfin, j’ai montré que dans certains cas, seul un petit nombre de mutations permettent la création d’un gène bien adapté à son environnement génomique, en comparaison avec des gènes plus «anciens». Cela signifie que sous certaines conditions la transition d’une séquence non-codante vers une séquence codante peut être relativement rapide. Globalement, mes résultats suggèrent que l’émergence de novo est un processus évolutif non négligeable, représentant une source importante de création de nouvelles protéines. === Gene repertoires are highly dynamic : Genes are duplicated, lost, transferred from one genome toanother and new genes are formed. Studying these processes and how they shape gene repertoireevolution is fundamental to our understanding of how the enormous diversity of life on earth came to be. I reconstructed the homologous gene families of the yeasts of the Lachancea genus and categorized them based on their conservation in species outside the genus into vertically inherited (98.2%), horizontally transferred (0.15%) and taxonomically restricted (1.63%). Then, I inferred the evolution of each family along the genus’ phylogeny and identified the gene gain and loss events that occurred since the genus’ origin. I found that balanced chromosomal rearrangements may be responsible for up to 14% of gene losses by disrupting the coding sequence at their breakpoints and detected 3 cases with clear traces of the disruption at the sequence level. Additionally, I found that correlations exist between the rate of protein-coding sequence divergence and the rates of gene duplication, chromosomal inversions and translocations, and gene disruptions by balanced rearrangements, suggesting the existence of a genomic clock coordinating these processes. Next, I focused on the emergence of new genes de novo from non-coding sequences, a process whose overall impact remains a matter of debate. I thus analyzed taxonomically restricted genes in the two model yeast genera Lachancea and Saccharomyces sensu stricto and identified a robust set of 596 genes that have likely emerged de novo. I found that de novo emergence rates are constant among yeasts of the same genus but differ by an order of magnitude between the two genera with 2.8 genes/my in the Saccharomyces and 0.27 genes/my in the Lachancea. De novo genes are uniformly distributed on yeast genomes and are found divergently oriented relative to their 5’ neighbors suggesting that divergent transcription might play a role in their transition from non-transcribed intergenic sequences to transcribed (and translated) coding sequences. Moreover, through specific examples I was able to show that a few enabling mutations are sufficient for a young de novo gene to emerge already well-adapted relative to older genes, indicating that the transition from non-coding to coding can happen rapidly. Overall, my results support de novo emergence as a ubiquitous evolutionary process and a potent source of novel proteins. |
author2 |
Paris 6 |
author_facet |
Paris 6 Vakirlis, Nikolaos |
author |
Vakirlis, Nikolaos |
author_sort |
Vakirlis, Nikolaos |
title |
Evolution of gene repertoires and new genes in yeasts |
title_short |
Evolution of gene repertoires and new genes in yeasts |
title_full |
Evolution of gene repertoires and new genes in yeasts |
title_fullStr |
Evolution of gene repertoires and new genes in yeasts |
title_full_unstemmed |
Evolution of gene repertoires and new genes in yeasts |
title_sort |
evolution of gene repertoires and new genes in yeasts |
publishDate |
2016 |
url |
http://www.theses.fr/2016PA066342 |
work_keys_str_mv |
AT vakirlisnikolaos evolutionofgenerepertoiresandnewgenesinyeasts AT vakirlisnikolaos evolutiondesrepertoiresdegenesetnouveauxgeneschezleslevures |
_version_ |
1718495098241548288 |
spelling |
ndltd-theses.fr-2016PA0663422017-07-11T04:45:09Z Evolution of gene repertoires and new genes in yeasts Evolution des répertoires de gènes et nouveaux gènes chez les levures Nouveaux gènes Répertoire de gènes Génomique comparative Evolution Levures Gènes de novo De novo genes Comparative genomics Gene repertoires 570 Les répertoires de gènes sont des objets extrêmement dynamiques : Des gènes sont dupliqués et perdus, transférés d’un génome à l’autre et des nouveaux gènes sont créés. L’étude de ces processus et de leur impact sur l’évolution des répertoires de gènes est fondamentale pour notre compréhension de l’énorme diversité de la vie sur terre. J’ai reconstruit les familles des gènes homologues chez les levures du clade Lachancea et je les ai classées en trois catégories selon leur présence chez les espèces en dehors du clade en: transmises verticalement (98.2 %), transmises horizontalement (0.15 %) et spécifiques aux Lachancea (1.63 %). Ensuite, j’ai reconstruit l’évolution de chaque famille de gènes le long de l’arbre phylogénétique des Lachancea en terme de gains et de pertes depuis l’origine du clade. Mes résultats suggèrent que les réarrangements chromosomiques balancés (translocations, inversions) peuvent interrompre, au niveau de leurs points de cassure, la séquence codante des gènes, et entraîner jusqu’à 14 % des pertes de gènes observées (rupture de gène). En outre, j’ai observé des corrélations entre le taux de divergence des séquences codant pour des protéines et les taux de duplication de gènes, de translocations et d’inversions, et de rupture de gène, suggérant l’existence d’une horloge génomique qui coordonnerait ces processus. Par la suite, je me suis focalisé sur l’émergence de nouveaux gènes de novo à partir de séquences non-codantes, dont l’impact global sur les génomes n’est pas encore connu. J’ai pour cela analysé les gènes taxonomiquement restreints aux levures des clades Lachancea et Saccharomyces sensu stricto et j’ai pu identifier un ensemble de 596 gènes ayant fort probablement émergé de novo. Le taux d’émergence de novo est constant chez les levures au sein du même clade mais varie d’un ordre de grandeur entre les 2 clades (2.8 gènes/ma chez les Saccharomyces et 0.27 gènes/ma chez les Lachancea). Ces nouveaux gènes sont distribués uniformément sur les chromosomes. Ils sont le plus souvent orientés de façon divergente par rapport à leur voisin en 5’, ce qui suggère que leur transcription pourrait être initiée au niveau de promoteurs divergents, favorisant ainsi la transition d’une séquence intergénique non transcrite à une séquence codante transcrite (puis traduite). Enfin, j’ai montré que dans certains cas, seul un petit nombre de mutations permettent la création d’un gène bien adapté à son environnement génomique, en comparaison avec des gènes plus «anciens». Cela signifie que sous certaines conditions la transition d’une séquence non-codante vers une séquence codante peut être relativement rapide. Globalement, mes résultats suggèrent que l’émergence de novo est un processus évolutif non négligeable, représentant une source importante de création de nouvelles protéines. Gene repertoires are highly dynamic : Genes are duplicated, lost, transferred from one genome toanother and new genes are formed. Studying these processes and how they shape gene repertoireevolution is fundamental to our understanding of how the enormous diversity of life on earth came to be. I reconstructed the homologous gene families of the yeasts of the Lachancea genus and categorized them based on their conservation in species outside the genus into vertically inherited (98.2%), horizontally transferred (0.15%) and taxonomically restricted (1.63%). Then, I inferred the evolution of each family along the genus’ phylogeny and identified the gene gain and loss events that occurred since the genus’ origin. I found that balanced chromosomal rearrangements may be responsible for up to 14% of gene losses by disrupting the coding sequence at their breakpoints and detected 3 cases with clear traces of the disruption at the sequence level. Additionally, I found that correlations exist between the rate of protein-coding sequence divergence and the rates of gene duplication, chromosomal inversions and translocations, and gene disruptions by balanced rearrangements, suggesting the existence of a genomic clock coordinating these processes. Next, I focused on the emergence of new genes de novo from non-coding sequences, a process whose overall impact remains a matter of debate. I thus analyzed taxonomically restricted genes in the two model yeast genera Lachancea and Saccharomyces sensu stricto and identified a robust set of 596 genes that have likely emerged de novo. I found that de novo emergence rates are constant among yeasts of the same genus but differ by an order of magnitude between the two genera with 2.8 genes/my in the Saccharomyces and 0.27 genes/my in the Lachancea. De novo genes are uniformly distributed on yeast genomes and are found divergently oriented relative to their 5’ neighbors suggesting that divergent transcription might play a role in their transition from non-transcribed intergenic sequences to transcribed (and translated) coding sequences. Moreover, through specific examples I was able to show that a few enabling mutations are sufficient for a young de novo gene to emerge already well-adapted relative to older genes, indicating that the transition from non-coding to coding can happen rapidly. Overall, my results support de novo emergence as a ubiquitous evolutionary process and a potent source of novel proteins. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016PA066342 Vakirlis, Nikolaos 2016-09-30 Paris 6 Lafontaine, Ingrid |