Interpreting the human transcriptome

The human body is made of billions of cells and nearly all have the same genome. However, there is a high diversity of cells, resulted from what part of the genome the cells use, i.e. which RNA molecules are expressed. Rapid advances within the field of sequencing allow us to determine the RNA molec...

Full description

Bibliographic Details
Main Author: Werne Solnestam, Beata
Format: Doctoral Thesis
Language:English
Published: KTH, Genteknologi 2015
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-158320
http://nbn-resolving.de/urn:isbn:978-91-7595-413-4
Description
Summary:The human body is made of billions of cells and nearly all have the same genome. However, there is a high diversity of cells, resulted from what part of the genome the cells use, i.e. which RNA molecules are expressed. Rapid advances within the field of sequencing allow us to determine the RNA molecules expressed in a specific cell at a certain time. The use of the new technologies has expanded our view of the human transcriptome and increased our understanding of when, where, and how each RNA molecule is expressed. The work presented in this thesis focuses on analysis of the human transcriptome. In Paper I, we describe an automated approach for sample preparation. This protocol was compared with the standard manual protocol, and we demonstrated that the automated version outperformed the manual process in terms of sample throughput while maintaining high reproducibility. Paper II addresses the impact of nuclear transcripts on gene expression. We compared total RNA from whole cells and from cytoplasm, showing that transcripts with long, structured 3’- and 5’-untranslated regions and transcripts with long protein coding sequences tended to be retained in the nucleus. This resulted in increased complexity of the total RNA fraction and fewer reads per unique transcript. Papers III and IV describe dynamics of the human muscle transcriptome. For Paper III, we systematically investigated the transcriptome and found remarkably high tissue homogeneity, however a large number of genes and isoforms were differentially expressed between genders. Paper IV describes transcriptome differences in response to repeated training. No transcriptome-based memory was observed, however a large number of isoforms and genes were affected by training. Paper V describes a transcript profiling protocol based on the method Reverse Transcriptase Multiplex Ligation-dependent Probe Amplification. We designed the method for a few selected transcripts whose expression patterns are important for detecting breast cancer cells, and optimized the method for single cell analysis. We successfully detected cells in human blood samples and applied the method to single cells, confirming the heterogeneity of a cell population. === Människokroppen är uppbyggd av miljarder celler och nästan alla innehåller samma arvsmassa. Trots detta finns det många olika celler med olika funktioner vilket är en följd av vilken del av arvsmassan som cellerna använder, dvs vilka RNA-molekyler som finns i varje cell. Den snabba utvecklingen av sekvenseringstekniker har gjort det möjligt att studera när, var och hur varje RNA-molekyl är uttryckt och att få en djupare förståelse för hur människans celler fungerar. Arbetet som presenteras i denna avhandling fokuserar på analys av RNA-molekyler i människans celler. I artikel I beskriver vi en automatiserad metod för att förbereda cellprov för RNA-sekvensering. Det automatiserade protokollet jämfördes med det manuella protokollet, och vi visade att det automatiserade protokollet överträffade det manuella när det gällde provkapacitet samtidigt som en höga reproducerbarheten behölls. I artikel II undersökte vi effekterna som RNA-molekyler från en del av cellen (cellkärnan) har på den totala mängden uttryckta RNA-molekyler. Vi jämförde RNA från hela cellen och från en del av cellen (cytoplasman) och visade att RNA-molekyler med långa och strukturerade 3'- och 5'-otranslaterade regioner och RNA-molekyler med långa proteinkodande sekvenser tenderade att hållas kvar i cellkärnan till en högre grad. Detta resulterade i en ökad komplexitet av RNA-molekylerna i hela cellen, medan vi i cytoplasma-fraktionen lättare kunde hitta de korta och svagt uttryckta RNA-molekyler. I Artikel III och IV studerar vi RNA-molekyler i människans skelettmuskler. I artikel III visar vi att andelen RNA-molekyler uttryckta i skelettmuskler är väldigt lika mellan muskler och mellan olika personer, men att ett stort antal RNA-molekyler var uttryckta i olika nivåer hos kvinnor och män. Artikel IV beskriver RNA-nivåer som svar på upprepade perioder av uthållighetsträning. Artikel V beskriver en metod för att studera ett fåtal utvalda RNA-molekyler. Vi valde RNA-molekyler vars uttryck är viktigt vid analys av bröstcancerceller, och optimerade metoden för analys av enskilda celler. Vi analyserade cancerceller från blodprov och använde metoden för att titta på RNA-nivåer i enskilda celler från en grupp av celler och visade på skillnader i RNA-nivåer inom gruppen. === <p>QC 20150115</p>