Resolving metagenomes usingsingle-molecule linked-readsequencing

The development of Massively Parallel Sequencing (MPS) has enabled more accurate and less time-consuming DNA sequencing. Although MPS technologies are theoretically applicable to all samples and species, the majority of studies on microorganisms have been conducted on those able to be isolated and c...

Full description

Bibliographic Details
Main Author: Theland, Jennifer
Format: Others
Language:English
Published: KTH, Skolan för kemi, bioteknologi och hälsa (CBH) 2018
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231412
id ndltd-UPSALLA1-oai-DiVA.org-kth-231412
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2314122018-08-15T05:39:55ZResolving metagenomes usingsingle-molecule linked-readsequencingengTheland, JenniferKTH, Skolan för kemi, bioteknologi och hälsa (CBH)2018DNA sequencinglinked-read sequencingDB-Seqmetagenomicsde novo assemblyOther Engineering and TechnologiesAnnan teknikThe development of Massively Parallel Sequencing (MPS) has enabled more accurate and less time-consuming DNA sequencing. Although MPS technologies are theoretically applicable to all samples and species, the majority of studies on microorganisms have been conducted on those able to be isolated and cultivated in laboratories. In the field of metagenomics, DNA from uncultivated environmental samples is analyzed. Whole genome sequencing of such complex samples poses difficult computational challenges due to the characteristics of metagenomic data, where one major challenge lies in determining the true origin of high similarity reads. In addition, the short-range information acquired from MPS reveals little about how reads from DNA sequencing fit together. Consequently, producing genome drafts from reads generated by MPS remains difficult. Here, the linked-read sequencing technology DB-Seq has been applied to bacterial samples in order to assess its potential in metagenomics. Specifically, its performance in retaining long-range information in de novo whole genome assembly has been tested. The results obtained in this initial study show great potential of DB-Seq in genome assembly, with significantly more contiguous results than conventional methods generate.   Utvecklingen av Massiv Parallel Sekvensering (MPS) har möjliggjort mer korrekt och mindre tidskrävande DNA sekvensering. Trots att MPS teoretiskt sett kan appliceras på alla provtyper och arter, har majoriteten av de studier som utförts på mikroorganismer varit fokuserade på de som kan isoleras och odlas i laboratorium. Inom ämnet metagenomik analyseras DNA från orörda miljöprover. Helgenomssekvensering av sådana prover ger upphov till komplicerade utmaningar för data-analys, där ett av de största problemen är att bestämma ursprunget av snarlika sekvenseringsresultat. Ytterligare komplikationer uppstår på grund av den data som erhålls från MPS, då denna ej ger information om hur sekvenseringsdata bör placeras i förhållande till varandra. Följdaktligen är det svårt att producera hopsatta genom utifrån MPS-data. I detta projekt har "linked-read"-sekvenseringsteknologin DB-Seq applicerats på bakterieprover för att undersöka metodens potential i metagenomik. Specifikt har metodens förmåga att bibehålla information om ursprungspositionen av sekvenseringsdata testats i de novo sammansättning av genom. De erhållna resultaten i denna förstagångsstudie tyder på stor potential för DB-Seq i genomsammansättning, med signifikant mer sammanhängande resultatsekvenser än vad konventionella metoder uppvisar.   Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231412application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic DNA sequencing
linked-read sequencing
DB-Seq
metagenomics
de novo assembly
Other Engineering and Technologies
Annan teknik
spellingShingle DNA sequencing
linked-read sequencing
DB-Seq
metagenomics
de novo assembly
Other Engineering and Technologies
Annan teknik
Theland, Jennifer
Resolving metagenomes usingsingle-molecule linked-readsequencing
description The development of Massively Parallel Sequencing (MPS) has enabled more accurate and less time-consuming DNA sequencing. Although MPS technologies are theoretically applicable to all samples and species, the majority of studies on microorganisms have been conducted on those able to be isolated and cultivated in laboratories. In the field of metagenomics, DNA from uncultivated environmental samples is analyzed. Whole genome sequencing of such complex samples poses difficult computational challenges due to the characteristics of metagenomic data, where one major challenge lies in determining the true origin of high similarity reads. In addition, the short-range information acquired from MPS reveals little about how reads from DNA sequencing fit together. Consequently, producing genome drafts from reads generated by MPS remains difficult. Here, the linked-read sequencing technology DB-Seq has been applied to bacterial samples in order to assess its potential in metagenomics. Specifically, its performance in retaining long-range information in de novo whole genome assembly has been tested. The results obtained in this initial study show great potential of DB-Seq in genome assembly, with significantly more contiguous results than conventional methods generate.   === Utvecklingen av Massiv Parallel Sekvensering (MPS) har möjliggjort mer korrekt och mindre tidskrävande DNA sekvensering. Trots att MPS teoretiskt sett kan appliceras på alla provtyper och arter, har majoriteten av de studier som utförts på mikroorganismer varit fokuserade på de som kan isoleras och odlas i laboratorium. Inom ämnet metagenomik analyseras DNA från orörda miljöprover. Helgenomssekvensering av sådana prover ger upphov till komplicerade utmaningar för data-analys, där ett av de största problemen är att bestämma ursprunget av snarlika sekvenseringsresultat. Ytterligare komplikationer uppstår på grund av den data som erhålls från MPS, då denna ej ger information om hur sekvenseringsdata bör placeras i förhållande till varandra. Följdaktligen är det svårt att producera hopsatta genom utifrån MPS-data. I detta projekt har "linked-read"-sekvenseringsteknologin DB-Seq applicerats på bakterieprover för att undersöka metodens potential i metagenomik. Specifikt har metodens förmåga att bibehålla information om ursprungspositionen av sekvenseringsdata testats i de novo sammansättning av genom. De erhållna resultaten i denna förstagångsstudie tyder på stor potential för DB-Seq i genomsammansättning, med signifikant mer sammanhängande resultatsekvenser än vad konventionella metoder uppvisar.  
author Theland, Jennifer
author_facet Theland, Jennifer
author_sort Theland, Jennifer
title Resolving metagenomes usingsingle-molecule linked-readsequencing
title_short Resolving metagenomes usingsingle-molecule linked-readsequencing
title_full Resolving metagenomes usingsingle-molecule linked-readsequencing
title_fullStr Resolving metagenomes usingsingle-molecule linked-readsequencing
title_full_unstemmed Resolving metagenomes usingsingle-molecule linked-readsequencing
title_sort resolving metagenomes usingsingle-molecule linked-readsequencing
publisher KTH, Skolan för kemi, bioteknologi och hälsa (CBH)
publishDate 2018
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-231412
work_keys_str_mv AT thelandjennifer resolvingmetagenomesusingsinglemoleculelinkedreadsequencing
_version_ 1718725196212338688