Evolution of gene repertoires and new genes in yeasts

Les répertoires de gènes sont des objets extrêmement dynamiques : Des gènes sont dupliqués et perdus, transférés d’un génome à l’autre et des nouveaux gènes sont créés. L’étude de ces processus et de leur impact sur l’évolution des répertoires de gènes est fondamentale pour notre compréhension de l’...

Full description

Bibliographic Details
Main Author: Vakirlis, Nikolaos
Other Authors: Paris 6
Language:en
Published: 2016
Subjects:
570
Online Access:http://www.theses.fr/2016PA066342
id ndltd-theses.fr-2016PA066342
record_format oai_dc
collection NDLTD
language en
sources NDLTD
topic Nouveaux gènes
Répertoire de gènes
Génomique comparative
Evolution
Levures
Gènes de novo
De novo genes
Comparative genomics
Gene repertoires
570
spellingShingle Nouveaux gènes
Répertoire de gènes
Génomique comparative
Evolution
Levures
Gènes de novo
De novo genes
Comparative genomics
Gene repertoires
570
Vakirlis, Nikolaos
Evolution of gene repertoires and new genes in yeasts
description Les répertoires de gènes sont des objets extrêmement dynamiques : Des gènes sont dupliqués et perdus, transférés d’un génome à l’autre et des nouveaux gènes sont créés. L’étude de ces processus et de leur impact sur l’évolution des répertoires de gènes est fondamentale pour notre compréhension de l’énorme diversité de la vie sur terre. J’ai reconstruit les familles des gènes homologues chez les levures du clade Lachancea et je les ai classées en trois catégories selon leur présence chez les espèces en dehors du clade en: transmises verticalement (98.2 %), transmises horizontalement (0.15 %) et spécifiques aux Lachancea (1.63 %). Ensuite, j’ai reconstruit l’évolution de chaque famille de gènes le long de l’arbre phylogénétique des Lachancea en terme de gains et de pertes depuis l’origine du clade. Mes résultats suggèrent que les réarrangements chromosomiques balancés (translocations, inversions) peuvent interrompre, au niveau de leurs points de cassure, la séquence codante des gènes, et entraîner jusqu’à 14 % des pertes de gènes observées (rupture de gène). En outre, j’ai observé des corrélations entre le taux de divergence des séquences codant pour des protéines et les taux de duplication de gènes, de translocations et d’inversions, et de rupture de gène, suggérant l’existence d’une horloge génomique qui coordonnerait ces processus. Par la suite, je me suis focalisé sur l’émergence de nouveaux gènes de novo à partir de séquences non-codantes, dont l’impact global sur les génomes n’est pas encore connu. J’ai pour cela analysé les gènes taxonomiquement restreints aux levures des clades Lachancea et Saccharomyces sensu stricto et j’ai pu identifier un ensemble de 596 gènes ayant fort probablement émergé de novo. Le taux d’émergence de novo est constant chez les levures au sein du même clade mais varie d’un ordre de grandeur entre les 2 clades (2.8 gènes/ma chez les Saccharomyces et 0.27 gènes/ma chez les Lachancea). Ces nouveaux gènes sont distribués uniformément sur les chromosomes. Ils sont le plus souvent orientés de façon divergente par rapport à leur voisin en 5’, ce qui suggère que leur transcription pourrait être initiée au niveau de promoteurs divergents, favorisant ainsi la transition d’une séquence intergénique non transcrite à une séquence codante transcrite (puis traduite). Enfin, j’ai montré que dans certains cas, seul un petit nombre de mutations permettent la création d’un gène bien adapté à son environnement génomique, en comparaison avec des gènes plus «anciens». Cela signifie que sous certaines conditions la transition d’une séquence non-codante vers une séquence codante peut être relativement rapide. Globalement, mes résultats suggèrent que l’émergence de novo est un processus évolutif non négligeable, représentant une source importante de création de nouvelles protéines. === Gene repertoires are highly dynamic : Genes are duplicated, lost, transferred from one genome toanother and new genes are formed. Studying these processes and how they shape gene repertoireevolution is fundamental to our understanding of how the enormous diversity of life on earth came to be. I reconstructed the homologous gene families of the yeasts of the Lachancea genus and categorized them based on their conservation in species outside the genus into vertically inherited (98.2%), horizontally transferred (0.15%) and taxonomically restricted (1.63%). Then, I inferred the evolution of each family along the genus’ phylogeny and identified the gene gain and loss events that occurred since the genus’ origin. I found that balanced chromosomal rearrangements may be responsible for up to 14% of gene losses by disrupting the coding sequence at their breakpoints and detected 3 cases with clear traces of the disruption at the sequence level. Additionally, I found that correlations exist between the rate of protein-coding sequence divergence and the rates of gene duplication, chromosomal inversions and translocations, and gene disruptions by balanced rearrangements, suggesting the existence of a genomic clock coordinating these processes. Next, I focused on the emergence of new genes de novo from non-coding sequences, a process whose overall impact remains a matter of debate. I thus analyzed taxonomically restricted genes in the two model yeast genera Lachancea and Saccharomyces sensu stricto and identified a robust set of 596 genes that have likely emerged de novo. I found that de novo emergence rates are constant among yeasts of the same genus but differ by an order of magnitude between the two genera with 2.8 genes/my in the Saccharomyces and 0.27 genes/my in the Lachancea. De novo genes are uniformly distributed on yeast genomes and are found divergently oriented relative to their 5’ neighbors suggesting that divergent transcription might play a role in their transition from non-transcribed intergenic sequences to transcribed (and translated) coding sequences. Moreover, through specific examples I was able to show that a few enabling mutations are sufficient for a young de novo gene to emerge already well-adapted relative to older genes, indicating that the transition from non-coding to coding can happen rapidly. Overall, my results support de novo emergence as a ubiquitous evolutionary process and a potent source of novel proteins.
author2 Paris 6
author_facet Paris 6
Vakirlis, Nikolaos
author Vakirlis, Nikolaos
author_sort Vakirlis, Nikolaos
title Evolution of gene repertoires and new genes in yeasts
title_short Evolution of gene repertoires and new genes in yeasts
title_full Evolution of gene repertoires and new genes in yeasts
title_fullStr Evolution of gene repertoires and new genes in yeasts
title_full_unstemmed Evolution of gene repertoires and new genes in yeasts
title_sort evolution of gene repertoires and new genes in yeasts
publishDate 2016
url http://www.theses.fr/2016PA066342
work_keys_str_mv AT vakirlisnikolaos evolutionofgenerepertoiresandnewgenesinyeasts
AT vakirlisnikolaos evolutiondesrepertoiresdegenesetnouveauxgeneschezleslevures
_version_ 1718495098241548288
spelling ndltd-theses.fr-2016PA0663422017-07-11T04:45:09Z Evolution of gene repertoires and new genes in yeasts Evolution des répertoires de gènes et nouveaux gènes chez les levures Nouveaux gènes Répertoire de gènes Génomique comparative Evolution Levures Gènes de novo De novo genes Comparative genomics Gene repertoires 570 Les répertoires de gènes sont des objets extrêmement dynamiques : Des gènes sont dupliqués et perdus, transférés d’un génome à l’autre et des nouveaux gènes sont créés. L’étude de ces processus et de leur impact sur l’évolution des répertoires de gènes est fondamentale pour notre compréhension de l’énorme diversité de la vie sur terre. J’ai reconstruit les familles des gènes homologues chez les levures du clade Lachancea et je les ai classées en trois catégories selon leur présence chez les espèces en dehors du clade en: transmises verticalement (98.2 %), transmises horizontalement (0.15 %) et spécifiques aux Lachancea (1.63 %). Ensuite, j’ai reconstruit l’évolution de chaque famille de gènes le long de l’arbre phylogénétique des Lachancea en terme de gains et de pertes depuis l’origine du clade. Mes résultats suggèrent que les réarrangements chromosomiques balancés (translocations, inversions) peuvent interrompre, au niveau de leurs points de cassure, la séquence codante des gènes, et entraîner jusqu’à 14 % des pertes de gènes observées (rupture de gène). En outre, j’ai observé des corrélations entre le taux de divergence des séquences codant pour des protéines et les taux de duplication de gènes, de translocations et d’inversions, et de rupture de gène, suggérant l’existence d’une horloge génomique qui coordonnerait ces processus. Par la suite, je me suis focalisé sur l’émergence de nouveaux gènes de novo à partir de séquences non-codantes, dont l’impact global sur les génomes n’est pas encore connu. J’ai pour cela analysé les gènes taxonomiquement restreints aux levures des clades Lachancea et Saccharomyces sensu stricto et j’ai pu identifier un ensemble de 596 gènes ayant fort probablement émergé de novo. Le taux d’émergence de novo est constant chez les levures au sein du même clade mais varie d’un ordre de grandeur entre les 2 clades (2.8 gènes/ma chez les Saccharomyces et 0.27 gènes/ma chez les Lachancea). Ces nouveaux gènes sont distribués uniformément sur les chromosomes. Ils sont le plus souvent orientés de façon divergente par rapport à leur voisin en 5’, ce qui suggère que leur transcription pourrait être initiée au niveau de promoteurs divergents, favorisant ainsi la transition d’une séquence intergénique non transcrite à une séquence codante transcrite (puis traduite). Enfin, j’ai montré que dans certains cas, seul un petit nombre de mutations permettent la création d’un gène bien adapté à son environnement génomique, en comparaison avec des gènes plus «anciens». Cela signifie que sous certaines conditions la transition d’une séquence non-codante vers une séquence codante peut être relativement rapide. Globalement, mes résultats suggèrent que l’émergence de novo est un processus évolutif non négligeable, représentant une source importante de création de nouvelles protéines. Gene repertoires are highly dynamic : Genes are duplicated, lost, transferred from one genome toanother and new genes are formed. Studying these processes and how they shape gene repertoireevolution is fundamental to our understanding of how the enormous diversity of life on earth came to be. I reconstructed the homologous gene families of the yeasts of the Lachancea genus and categorized them based on their conservation in species outside the genus into vertically inherited (98.2%), horizontally transferred (0.15%) and taxonomically restricted (1.63%). Then, I inferred the evolution of each family along the genus’ phylogeny and identified the gene gain and loss events that occurred since the genus’ origin. I found that balanced chromosomal rearrangements may be responsible for up to 14% of gene losses by disrupting the coding sequence at their breakpoints and detected 3 cases with clear traces of the disruption at the sequence level. Additionally, I found that correlations exist between the rate of protein-coding sequence divergence and the rates of gene duplication, chromosomal inversions and translocations, and gene disruptions by balanced rearrangements, suggesting the existence of a genomic clock coordinating these processes. Next, I focused on the emergence of new genes de novo from non-coding sequences, a process whose overall impact remains a matter of debate. I thus analyzed taxonomically restricted genes in the two model yeast genera Lachancea and Saccharomyces sensu stricto and identified a robust set of 596 genes that have likely emerged de novo. I found that de novo emergence rates are constant among yeasts of the same genus but differ by an order of magnitude between the two genera with 2.8 genes/my in the Saccharomyces and 0.27 genes/my in the Lachancea. De novo genes are uniformly distributed on yeast genomes and are found divergently oriented relative to their 5’ neighbors suggesting that divergent transcription might play a role in their transition from non-transcribed intergenic sequences to transcribed (and translated) coding sequences. Moreover, through specific examples I was able to show that a few enabling mutations are sufficient for a young de novo gene to emerge already well-adapted relative to older genes, indicating that the transition from non-coding to coding can happen rapidly. Overall, my results support de novo emergence as a ubiquitous evolutionary process and a potent source of novel proteins. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016PA066342 Vakirlis, Nikolaos 2016-09-30 Paris 6 Lafontaine, Ingrid