Nouvelles approches pour l'exploitation des données de séquences génomique haut débit

Cette thèse a pour sujet les méthodes informatiques traitant les séquences ADN provenant des séquenceurs haut débit. Nous nous concentrons essentiellement sur la reconstruction de génomes à partir de fragments ADN (assemblage génomique) et sur des problèmes connexes. Ces tâches combinent de très gra...

Full description

Bibliographic Details
Main Author: Limasset, Antoine
Other Authors: Rennes 1
Language:fr
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017REN1S049/document
id ndltd-theses.fr-2017REN1S049
record_format oai_dc
spelling ndltd-theses.fr-2017REN1S0492018-01-19T04:14:35Z Nouvelles approches pour l'exploitation des données de séquences génomique haut débit New approaches for exploitation of high throughput sequencing data Assemblage génomique Structure de données Génomique Genomics Cette thèse a pour sujet les méthodes informatiques traitant les séquences ADN provenant des séquenceurs haut débit. Nous nous concentrons essentiellement sur la reconstruction de génomes à partir de fragments ADN (assemblage génomique) et sur des problèmes connexes. Ces tâches combinent de très grandes quantités de données et des problèmes combinatoires. Différentes structures de graphe sont utilisées pour répondre à ces problèmes, présentant des compromis entre passage à l'échelle et qualité d'assemblage. Ce document introduit plusieurs contributions pour répondre à ces problèmes. De nouvelles représentations de graphes d'assemblage sont proposées pour autoriser un meilleur passage à l'échelle. Nous présentons également de nouveaux usages de ces graphes, différent de l'assemblage, ainsi que des outils pour utiliser ceux-ci comme références dans les cas où un génome de référence n'est pas disponible. Pour finir nous montrons comment utiliser ces méthodes pour produire un meilleur assemblage en utilisant des ressources raisonnables. Novel approaches for the exploitation of high throughput sequencing data In this thesis we discuss computational methods to deal with DNA sequences provided by high throughput sequencers. We will mostly focus on the reconstruction of genomes from DNA fragments (genome assembly) and closely related problems. These tasks combine huge amounts of data with combinatorial problems. Various graph structures are used to handle this problem, presenting trade-off between scalability and assembly quality. This thesis introduces several contributions in order to cope with these tasks. First, novel representations of assembly graphs are proposed to allow a better scaling. We also present novel uses of those graphs apart from assembly and we propose tools to use such graphs as references when a fully assembled genome is not available. Finally we show how to use those methods to produce less fragmented assembly while remaining tractable. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2017REN1S049/document Limasset, Antoine 2017-07-12 Rennes 1 Lavenier, Dominique Peterlongo, Pierre
collection NDLTD
language fr
sources NDLTD
topic Assemblage génomique
Structure de données
Génomique
Genomics

spellingShingle Assemblage génomique
Structure de données
Génomique
Genomics

Limasset, Antoine
Nouvelles approches pour l'exploitation des données de séquences génomique haut débit
description Cette thèse a pour sujet les méthodes informatiques traitant les séquences ADN provenant des séquenceurs haut débit. Nous nous concentrons essentiellement sur la reconstruction de génomes à partir de fragments ADN (assemblage génomique) et sur des problèmes connexes. Ces tâches combinent de très grandes quantités de données et des problèmes combinatoires. Différentes structures de graphe sont utilisées pour répondre à ces problèmes, présentant des compromis entre passage à l'échelle et qualité d'assemblage. Ce document introduit plusieurs contributions pour répondre à ces problèmes. De nouvelles représentations de graphes d'assemblage sont proposées pour autoriser un meilleur passage à l'échelle. Nous présentons également de nouveaux usages de ces graphes, différent de l'assemblage, ainsi que des outils pour utiliser ceux-ci comme références dans les cas où un génome de référence n'est pas disponible. Pour finir nous montrons comment utiliser ces méthodes pour produire un meilleur assemblage en utilisant des ressources raisonnables. === Novel approaches for the exploitation of high throughput sequencing data In this thesis we discuss computational methods to deal with DNA sequences provided by high throughput sequencers. We will mostly focus on the reconstruction of genomes from DNA fragments (genome assembly) and closely related problems. These tasks combine huge amounts of data with combinatorial problems. Various graph structures are used to handle this problem, presenting trade-off between scalability and assembly quality. This thesis introduces several contributions in order to cope with these tasks. First, novel representations of assembly graphs are proposed to allow a better scaling. We also present novel uses of those graphs apart from assembly and we propose tools to use such graphs as references when a fully assembled genome is not available. Finally we show how to use those methods to produce less fragmented assembly while remaining tractable.
author2 Rennes 1
author_facet Rennes 1
Limasset, Antoine
author Limasset, Antoine
author_sort Limasset, Antoine
title Nouvelles approches pour l'exploitation des données de séquences génomique haut débit
title_short Nouvelles approches pour l'exploitation des données de séquences génomique haut débit
title_full Nouvelles approches pour l'exploitation des données de séquences génomique haut débit
title_fullStr Nouvelles approches pour l'exploitation des données de séquences génomique haut débit
title_full_unstemmed Nouvelles approches pour l'exploitation des données de séquences génomique haut débit
title_sort nouvelles approches pour l'exploitation des données de séquences génomique haut débit
publishDate 2017
url http://www.theses.fr/2017REN1S049/document
work_keys_str_mv AT limassetantoine nouvellesapprochespourlexploitationdesdonneesdesequencesgenomiquehautdebit
AT limassetantoine newapproachesforexploitationofhighthroughputsequencingdata
_version_ 1718611566886125568