Développement d'outils bio-informatique pour l'étude de la transcription cryptique

Les expériences de séquençage à haut débit ont permis de démontrer que la transcription ne se limite pas aux régions codantes et qu’une grande partie du génome est transcrite en ARN non-codants (ARNnc). Parmi eux, les transcrits cryptiques sont initiés à l’intérieur des régions codantes. Des études...

Full description

Bibliographic Details
Main Author: Uwimana, Nicole
Other Authors: Robert, François
Language:fr
Published: 2017
Subjects:
Online Access:http://hdl.handle.net/1866/18644
id ndltd-umontreal.ca-oai-papyrus.bib.umontreal.ca-1866-18644
record_format oai_dc
collection NDLTD
language fr
sources NDLTD
topic Transcription cryptique
Terminateurs bidirectionnels
RNA-Seq
Spt6
Cryptic transcription
Bidirectional terminators
Biology - Molecular / Biologie - Biologie moléculaire (UMI : 0307)
spellingShingle Transcription cryptique
Terminateurs bidirectionnels
RNA-Seq
Spt6
Cryptic transcription
Bidirectional terminators
Biology - Molecular / Biologie - Biologie moléculaire (UMI : 0307)
Uwimana, Nicole
Développement d'outils bio-informatique pour l'étude de la transcription cryptique
description Les expériences de séquençage à haut débit ont permis de démontrer que la transcription ne se limite pas aux régions codantes et qu’une grande partie du génome est transcrite en ARN non-codants (ARNnc). Parmi eux, les transcrits cryptiques sont initiés à l’intérieur des régions codantes. Des études faites chez la levure Saccharomyces cerevisiae, ont pu identifier plusieurs facteurs qui répriment la transcription cryptique. Un de ces facteurs est Spt6, une chaperonne d’histones requise pour le maintien d’un bon niveau de nucléosomes le long des gènes transcrits. Lorsque Spt6 est muté, on observe une déplétion des nucléosomes conduisant à l’activation des promoteurs cryptiques. Cependant, le mécanisme par lequel ces transcrits cryptiques sont régulés n’est pas encore clair. Dans ce mémoire, nous présentons un travail dans lequel nous avons développé une méthode probabiliste dans le but de caractériser les transcrits cryptiques à partir de données de RNA-Seq. Cette méthode est basée sur une cumulation des données et permet de tenir compte des variations dans l’expression et dans la longueur des gènes, grâce à une étape de randomisation des données. Les résultats démontrent que notre méthode est au moins aussi efficace que les méthodes précédemment décrites dans la littérature et offre un bon compromis entre le taux de faux positifs et de faux négatifs. Enfin, le plus important est que cette méthode permet de prédire les régions génomiques où les transcrits cryptiques sont initiés. Nous avons mis en évidence la présence de transcrits cryptiques sur les brins sens et antisens par rapport au gène. Nous avons également montré que les promoteurs cryptiques sens et antisens sont enrichis en motif TATA et que les transcrits cryptiques sont polyadénylés, ce qui suggère qu’ils peuvent être régulés par les mêmes mécanismes qui régulent les gènes. Alors que les transcrits cryptiques sur le brin sens se terminent à la même position que les gènes dont ils sont issus, les transcrits cryptiques sur le brin antisens terminent préférablement aux extrémités 3’ des gènes situés en amont. Nous proposons donc que les terminateurs chez S. cerevisiae ont évolué pour terminer la transcription de manière bidirectionnelle afin d’empêcher une transcription aberrante qui pourrait envahir les gènes voisins. === High throughout sequencing experiments have shown that transcription in not limited to coding regions and that most of the genome is transcribed into non-coding RNA (ncRNA). Among them, cryptic transcripts are aberrantly initiated from within the coding regions. Several studies in Saccharomyces cerevisiae have identified many factors that suppress cryptic transcription. One such factor is Spt6, a histone chaperone required for maintaining appropriate nucleosome levels on transcribed genes. In Spt6 mutant cells, nucleosomes are depleted, leading to activation of cryptic promoters. However, the mechanism by which these cryptic transcripts are regulated remains unclear. In this thesis, we present the development of a probabilistic method for the characterization of cryptic transcripts from RNA-Seq data. The method is used to characterize cryptic transcription in spt6-1004 cells. The method is based on a cumulative distribution function, thus taking into account variations in gene expression and gene length thanks to a data randomization step. Results show that our method is at least as good as previously published methods and provides a good compromise between false positives and false negatives. Importantly, this method allows for the prediction of genomic regions where cryptic transcripts are initiated. We have demonstrated the presence of cryptic transcripts running on the sense and antisense strands relative to genes. We also showed that, both sense and antisense cryptic promoters are enriched for TATA-like sequences and that cryptic transcripts are polyadenylated, suggesting that they may be regulated by the same mechanism that occurs on genes. While the cryptic transcripts on the sense strand terminate at the same position as the genes from which they are derived, cryptic transcripts on the antisense strand preferentially terminate at the 3’-end of upstream genes. We therefore propose that S. cerevisiae terminators have evolved to terminate transcription bidirectionally in order to prevent an aberrant transcription that could invade neighboring genes.
author2 Robert, François
author_facet Robert, François
Uwimana, Nicole
author Uwimana, Nicole
author_sort Uwimana, Nicole
title Développement d'outils bio-informatique pour l'étude de la transcription cryptique
title_short Développement d'outils bio-informatique pour l'étude de la transcription cryptique
title_full Développement d'outils bio-informatique pour l'étude de la transcription cryptique
title_fullStr Développement d'outils bio-informatique pour l'étude de la transcription cryptique
title_full_unstemmed Développement d'outils bio-informatique pour l'étude de la transcription cryptique
title_sort développement d'outils bio-informatique pour l'étude de la transcription cryptique
publishDate 2017
url http://hdl.handle.net/1866/18644
work_keys_str_mv AT uwimananicole developpementdoutilsbioinformatiquepourletudedelatranscriptioncryptique
_version_ 1718450542782447616
spelling ndltd-umontreal.ca-oai-papyrus.bib.umontreal.ca-1866-186442017-05-21T05:25:52Z Développement d'outils bio-informatique pour l'étude de la transcription cryptique Uwimana, Nicole Robert, François Transcription cryptique Terminateurs bidirectionnels RNA-Seq Spt6 Cryptic transcription Bidirectional terminators Biology - Molecular / Biologie - Biologie moléculaire (UMI : 0307) Les expériences de séquençage à haut débit ont permis de démontrer que la transcription ne se limite pas aux régions codantes et qu’une grande partie du génome est transcrite en ARN non-codants (ARNnc). Parmi eux, les transcrits cryptiques sont initiés à l’intérieur des régions codantes. Des études faites chez la levure Saccharomyces cerevisiae, ont pu identifier plusieurs facteurs qui répriment la transcription cryptique. Un de ces facteurs est Spt6, une chaperonne d’histones requise pour le maintien d’un bon niveau de nucléosomes le long des gènes transcrits. Lorsque Spt6 est muté, on observe une déplétion des nucléosomes conduisant à l’activation des promoteurs cryptiques. Cependant, le mécanisme par lequel ces transcrits cryptiques sont régulés n’est pas encore clair. Dans ce mémoire, nous présentons un travail dans lequel nous avons développé une méthode probabiliste dans le but de caractériser les transcrits cryptiques à partir de données de RNA-Seq. Cette méthode est basée sur une cumulation des données et permet de tenir compte des variations dans l’expression et dans la longueur des gènes, grâce à une étape de randomisation des données. Les résultats démontrent que notre méthode est au moins aussi efficace que les méthodes précédemment décrites dans la littérature et offre un bon compromis entre le taux de faux positifs et de faux négatifs. Enfin, le plus important est que cette méthode permet de prédire les régions génomiques où les transcrits cryptiques sont initiés. Nous avons mis en évidence la présence de transcrits cryptiques sur les brins sens et antisens par rapport au gène. Nous avons également montré que les promoteurs cryptiques sens et antisens sont enrichis en motif TATA et que les transcrits cryptiques sont polyadénylés, ce qui suggère qu’ils peuvent être régulés par les mêmes mécanismes qui régulent les gènes. Alors que les transcrits cryptiques sur le brin sens se terminent à la même position que les gènes dont ils sont issus, les transcrits cryptiques sur le brin antisens terminent préférablement aux extrémités 3’ des gènes situés en amont. Nous proposons donc que les terminateurs chez S. cerevisiae ont évolué pour terminer la transcription de manière bidirectionnelle afin d’empêcher une transcription aberrante qui pourrait envahir les gènes voisins. High throughout sequencing experiments have shown that transcription in not limited to coding regions and that most of the genome is transcribed into non-coding RNA (ncRNA). Among them, cryptic transcripts are aberrantly initiated from within the coding regions. Several studies in Saccharomyces cerevisiae have identified many factors that suppress cryptic transcription. One such factor is Spt6, a histone chaperone required for maintaining appropriate nucleosome levels on transcribed genes. In Spt6 mutant cells, nucleosomes are depleted, leading to activation of cryptic promoters. However, the mechanism by which these cryptic transcripts are regulated remains unclear. In this thesis, we present the development of a probabilistic method for the characterization of cryptic transcripts from RNA-Seq data. The method is used to characterize cryptic transcription in spt6-1004 cells. The method is based on a cumulative distribution function, thus taking into account variations in gene expression and gene length thanks to a data randomization step. Results show that our method is at least as good as previously published methods and provides a good compromise between false positives and false negatives. Importantly, this method allows for the prediction of genomic regions where cryptic transcripts are initiated. We have demonstrated the presence of cryptic transcripts running on the sense and antisense strands relative to genes. We also showed that, both sense and antisense cryptic promoters are enriched for TATA-like sequences and that cryptic transcripts are polyadenylated, suggesting that they may be regulated by the same mechanism that occurs on genes. While the cryptic transcripts on the sense strand terminate at the same position as the genes from which they are derived, cryptic transcripts on the antisense strand preferentially terminate at the 3’-end of upstream genes. We therefore propose that S. cerevisiae terminators have evolved to terminate transcription bidirectionally in order to prevent an aberrant transcription that could invade neighboring genes. 2017-05-19T18:51:13Z MONTHS_WITHHELD:24 2017-05-19T18:51:13Z 2017-03-30 2016-08 Thèse ou Mémoire numérique / Electronic Thesis or Dissertation http://hdl.handle.net/1866/18644 fr