Approches statistiques en segmentation : application à la ré-annotation de génome

Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont dev...

Full description

Bibliographic Details
Main Author: Cleynen, Alice
Language:English
Published: Université Paris Sud - Paris XI 2013
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00913851
http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013_synthese_en_francais.pdf
http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00913851
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-009138512014-10-08T03:28:14Z http://tel.archives-ouvertes.fr/tel-00913851 2013PA112258 http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013_synthese_en_francais.pdf http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013.pdf Approches statistiques en segmentation : application à la ré-annotation de génome Cleynen, Alice [MATH:MATH_GM] Mathematics/General Mathematics [MATH:MATH_GM] Mathématiques/Mathématiques générales Segmentation Binomiale négative Algorithmes Intervalles de crédibilité Sélection de modèle RNA-Seq Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont devenues un outil précieux pour l'annotation de génome, l'analyse de l'expression des gènes, et la détection de nouveaux transcrits. Nous développons un algorithme de segmentation rapide pour analyser des séries à l'échelle du chromosome, et nous proposons deux méthodes pour l'estimation du nombre de segments, directement lié au nombre de gènes exprimés dans la cellule, qu'ils soient précédemment annotés ou détectés à cette même occasion. L'objectif d'annotation précise des gènes, et plus particulièrement de comparaison des sites de début et fin de transcription entre individus, nous amène naturellement à nous intéresser à la comparaison des localisations de ruptures dans des séries indépendantes. Nous construisons ainsi dans un cadre de segmentation bayésienne des outils de réponse à nos questions pour lesquels nous sommes capable de fournir des mesures d'incertitude. Nous illustrons nos modèles, tous implémentés dans des packages R, sur des données RNA-Seq provenant d'expériences sur la levure, et montrons par exemple que les frontières des introns sont conservées entre conditions tandis que les débuts et fin de transcriptions sont soumis à l'épissage différentiel. 2013-11-15 eng PhD thesis Université Paris Sud - Paris XI
collection NDLTD
language English
sources NDLTD
topic [MATH:MATH_GM] Mathematics/General Mathematics
[MATH:MATH_GM] Mathématiques/Mathématiques générales
Segmentation
Binomiale négative
Algorithmes
Intervalles de crédibilité
Sélection de modèle
RNA-Seq
spellingShingle [MATH:MATH_GM] Mathematics/General Mathematics
[MATH:MATH_GM] Mathématiques/Mathématiques générales
Segmentation
Binomiale négative
Algorithmes
Intervalles de crédibilité
Sélection de modèle
RNA-Seq
Cleynen, Alice
Approches statistiques en segmentation : application à la ré-annotation de génome
description Nous proposons de modéliser les données issues des technologies de séquençage du transcriptome (RNA-Seq) à l'aide de la loi binomiale négative, et nous construisons des modèles de segmentation adaptés à leur étude à différentes échelles biologiques, dans le contexte où ces technologies sont devenues un outil précieux pour l'annotation de génome, l'analyse de l'expression des gènes, et la détection de nouveaux transcrits. Nous développons un algorithme de segmentation rapide pour analyser des séries à l'échelle du chromosome, et nous proposons deux méthodes pour l'estimation du nombre de segments, directement lié au nombre de gènes exprimés dans la cellule, qu'ils soient précédemment annotés ou détectés à cette même occasion. L'objectif d'annotation précise des gènes, et plus particulièrement de comparaison des sites de début et fin de transcription entre individus, nous amène naturellement à nous intéresser à la comparaison des localisations de ruptures dans des séries indépendantes. Nous construisons ainsi dans un cadre de segmentation bayésienne des outils de réponse à nos questions pour lesquels nous sommes capable de fournir des mesures d'incertitude. Nous illustrons nos modèles, tous implémentés dans des packages R, sur des données RNA-Seq provenant d'expériences sur la levure, et montrons par exemple que les frontières des introns sont conservées entre conditions tandis que les débuts et fin de transcriptions sont soumis à l'épissage différentiel.
author Cleynen, Alice
author_facet Cleynen, Alice
author_sort Cleynen, Alice
title Approches statistiques en segmentation : application à la ré-annotation de génome
title_short Approches statistiques en segmentation : application à la ré-annotation de génome
title_full Approches statistiques en segmentation : application à la ré-annotation de génome
title_fullStr Approches statistiques en segmentation : application à la ré-annotation de génome
title_full_unstemmed Approches statistiques en segmentation : application à la ré-annotation de génome
title_sort approches statistiques en segmentation : application à la ré-annotation de génome
publisher Université Paris Sud - Paris XI
publishDate 2013
url http://tel.archives-ouvertes.fr/tel-00913851
http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013_synthese_en_francais.pdf
http://tel.archives-ouvertes.fr/docs/00/91/38/51/PDF/VD2_CLEYNEN_ALICE_15112013.pdf
work_keys_str_mv AT cleynenalice approchesstatistiquesensegmentationapplicationalareannotationdegenome
_version_ 1716716242753028096