Quantifying Differences in Gene Networks via Graph Curvature

Fast improvements of technologies for the acquirement of large genomic data through single cell RNA-sequencing have led to a need for new mathematical methods for the analysis of such data. One approach of representing this data that has emerged over the last couple of decades is through graph repre...

Full description

Bibliographic Details
Main Author: Sundström, Viktor
Format: Others
Language:English
Published: KTH, Optimeringslära och systemteori 2019
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-253364
Description
Summary:Fast improvements of technologies for the acquirement of large genomic data through single cell RNA-sequencing have led to a need for new mathematical methods for the analysis of such data. One approach of representing this data that has emerged over the last couple of decades is through graph representations, i.e. as networks that describes how genes interact with each other. There has since then been a development of a multitude of methods based on these so-called co-expression networks for gene analysis. More recently, a notion of curvature has provided a methodology for quantifying differences and similarities in these large graphs, but better understanding of the methods are still needed, especially when the networks considered grows larger and larger. Pompe disease is a rare genetic disorder caused due to mutations in the GAA gene which codes the enzyme acid alpha glucosidase (GAA). Current treatment involves enzyme replacement therapy and the side effects vary between patients. Here we develop an approach to identify genes and pathways that can reduce the disease pathology by utilizing concominant treatments or reduce the immunogenicity of current treatments. In this project we use single cell RNA-sequencing of hundreds of cells from real patients to generate networks describing gene interactions. The Ollivier-Ricci curvature is calculated for the large networks using entropy-regulated optimal mass transport. The top genes we identify by our method have a strong presence in prior literature in association with lysosomal and mitochondrial diseases. This positive verification from scientific literature makes this methodology for narrowing down genes of interest promising. === En snabb utveckling av teknologi kapabel att generera stora genomiska datamängder genom encellig RNA-sekvensering har lett till behovet av nya matematiska metoder för analys av sådan data. Ett sätt att representera denna data som har blivit populärt under de senaste decennierna är genom grafrepresentationer, nätverk som beskriver hur gener interagerar med varandra. Sedan dess har det utvecklats en mängd metoder baserade på dessa nätverk. På senare tid har metoder baserade på grafkrökning skapat ett sätt att differentiera dessa stora grafer, men bättre förståelse av metoderna behövs, särskilt när de nätverken blir större och större. Pompes sjukdom är en sällsynt genetisk sjukdom orsakad på grund av mutationer i GAA-genen som kodar för enzymet acid alpha glucosidase (GAA). Den nuvarande behandlingen innebär enzymbehandling (ERT) och biverkningarna varierar mellan patienter. Här utvecklar vi ett sätt att identifiera gener som kan förbättra sjukdomen genom att använda sammansatta behandlingar eller minska immunogeniciteten hos nuvarande behandlingar. I detta projekt använder vi RNA-sekvensering av hundratals celler ifrån patienter för att generera nätverk som beskriver geninteraktioner. Ollivier-Riccikrökningen räknas ut för de stora nätverken genom entropi-regulariserad optimal masstransport. Generna vi identifierar med vår metod har en stark närvaro i tidigare litteratur i samband med lysosomala och mitokondriska sjukdomar. Denna positiva verifiering från vetenskaplig litteratur gör denna metod för att begränsa gener av intresse lovande.