Approches statistiques en segmentation : application à la ré-annotation de génome
Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont dev...
Main Author: | |
---|---|
Language: | English |
Published: |
Université Paris Sud - Paris XI
2013
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00913851 http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013_synthese_en_francais.pdf http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013.pdf |
id |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00913851 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009138512014-10-08T03:28:14Z http://tel.archives-ouvertes.fr/tel-00913851 2013PA112258 http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013_synthese_en_francais.pdf http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013.pdf Approches statistiques en segmentation : application à la ré-annotation de génome Cleynen, Alice [MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Segmentation Binomiale négative Algorithmes Intervalles de crédibilité Sélection de modèle RNA-Seq Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont devenues un outil précieux pour l'annotation de génome, l'analyse de l'expression des gènes, et la détection de nouveaux transcrits. Nous développons un algorithme de segmentation rapide pour analyser des séries à l'échelle du chromosome, et nous proposons deux méthodes pour l'estimation du nombre de segments, directement lié au nombre de gènes exprimés dans la cellule, qu'ils soient précédemment annotés ou détectés à cette même occasion. L'objectif d'annotation précise des gènes, et plus particulièrement de comparaison des sites de début et fin de transcription entre individus, nous amène naturellement à nous intéresser à la comparaison des localisations de ruptures dans des séries indépendantes. Nous construisons ainsi dans un cadre de segmentation bayésienne des outils de réponse à nos questions pour lesquels nous sommes capable de fournir des mesures d'incertitude. Nous illustrons nos modèles, tous implémentés dans des packages R, sur des données RNA-Seq provenant d'expériences sur la levure, et montrons par exemple que les frontières des introns sont conservées entre conditions tandis que les débuts et fin de transcriptions sont soumis à l'épissage différentiel. 2013-11-15 eng PhD thesis Université Paris Sud - Paris XI |
collection |
NDLTD |
language |
English |
sources |
NDLTD |
topic |
[MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Segmentation Binomiale négative Algorithmes Intervalles de crédibilité Sélection de modèle RNA-Seq |
spellingShingle |
[MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Segmentation Binomiale négative Algorithmes Intervalles de crédibilité Sélection de modèle RNA-Seq Cleynen, Alice Approches statistiques en segmentation : application à la ré-annotation de génome |
description |
Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont devenues un outil précieux pour l'annotation de génome, l'analyse de l'expression des gènes, et la détection de nouveaux transcrits. Nous développons un algorithme de segmentation rapide pour analyser des séries à l'échelle du chromosome, et nous proposons deux méthodes pour l'estimation du nombre de segments, directement lié au nombre de gènes exprimés dans la cellule, qu'ils soient précédemment annotés ou détectés à cette même occasion. L'objectif d'annotation précise des gènes, et plus particulièrement de comparaison des sites de début et fin de transcription entre individus, nous amène naturellement à nous intéresser à la comparaison des localisations de ruptures dans des séries indépendantes. Nous construisons ainsi dans un cadre de segmentation bayésienne des outils de réponse à nos questions pour lesquels nous sommes capable de fournir des mesures d'incertitude. Nous illustrons nos modèles, tous implémentés dans des packages R, sur des données RNA-Seq provenant d'expériences sur la levure, et montrons par exemple que les frontières des introns sont conservées entre conditions tandis que les débuts et fin de transcriptions sont soumis à l'épissage différentiel. |
author |
Cleynen, Alice |
author_facet |
Cleynen, Alice |
author_sort |
Cleynen, Alice |
title |
Approches statistiques en segmentation : application à la ré-annotation de génome |
title_short |
Approches statistiques en segmentation : application à la ré-annotation de génome |
title_full |
Approches statistiques en segmentation : application à la ré-annotation de génome |
title_fullStr |
Approches statistiques en segmentation : application à la ré-annotation de génome |
title_full_unstemmed |
Approches statistiques en segmentation : application à la ré-annotation de génome |
title_sort |
approches statistiques en segmentation : application à la ré-annotation de génome |
publisher |
Université Paris Sud - Paris XI |
publishDate |
2013 |
url |
http://tel.archives-ouvertes.fr/tel-00913851 http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013_synthese_en_francais.pdf http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013.pdf |
work_keys_str_mv |
AT cleynenalice approchesstatistiquesensegmentationapplicationalareannotationdegenome |
_version_ |
1716716242753028096 |