A Statistical Framework for Classification of Tumor Type from microRNA Data

Hepatocellular carcinoma (HCC) is a type of liver cancer with low survival rate, not least due to the difficulty of diagnosing it in an early stage. The objective of this thesis is to build a random forest classification method based on microRNA (and messenger RNA) expression profiles from patients...

Full description

Bibliographic Details
Main Author: Röhss, Josefine
Format: Others
Language:English
Published: KTH, Matematisk statistik 2016
Subjects:
HCC
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-191990
id ndltd-UPSALLA1-oai-DiVA.org-kth-191990
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-1919902016-09-04T05:06:19ZA Statistical Framework for Classification of Tumor Type from microRNA DataengEtt statistiskt ramverk för klassificering av tumörtyp från mikroRNA dataRöhss, JosefineKTH, Matematisk statistik2016miRNAmRNArandom forestclassificationHCCdiagnosisHepatocellular carcinoma (HCC) is a type of liver cancer with low survival rate, not least due to the difficulty of diagnosing it in an early stage. The objective of this thesis is to build a random forest classification method based on microRNA (and messenger RNA) expression profiles from patients with HCC. The main purpose is to be able to distinguish between tumor samples and normal samples by measuring the miRNA expression. If successful, this method can be used to detect HCC at an earlier stage and to design new therapeutics. The microRNAs and messenger RNAs which have a significant difference in expression between tumor samples and normal samples are selected for building random forest classification models. These models are then tested on paired samples of tumor and surrounding normal tissue from patients with HCC. The results show that the classification models built for classifying tumor and normal samples have high prediction accuracy and hence show high potential for using microRNA and messenger RNA expression levels for diagnosis of HCC. Hepatocellulär cancer (HCC) är en typ av levercancer med mycket låg överlevnadsgrad, inte minst på grund av svårigheten att diagnosticera i ett tidigt skede. Syftet med det här projektet är att bygga en klassificeringsmodell med random forest, baserad på uttrycksprofiler av mikroRNA (och budbärar-RNA) från patienter med HCC. Målet är att kunna skilja mellan tumörprover och normala prover genom att mäta uttrycket av mikroRNA. Om detta mål uppnås kan metoden användas för att upptäcka HCC i ett tidigare skede och för att utveckla nya läkemedel. De mikroRNA och budbärar-RNA som har en signifikant skillnad i uttryck mellan prover från tumörvävnad och intilliggande normal vävnad väljs ut för att bygga klassificaringsmodeller med random forest. Dessa modeller testas sedan på parade prover av tumörvävnad och intilliggande vävnad från patienter med HCC. Resultaten visar att modeller som byggs med denna metod kan klassificera tumörprover och normala prover med hög noggrannhet. Det finns således stor potential för att använda uttrycksprofiler från mikroRNA och budbärar-RNA för att diagnosticera HCC. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-191990TRITA-MAT-E ; 2016:46application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic miRNA
mRNA
random forest
classification
HCC
diagnosis
spellingShingle miRNA
mRNA
random forest
classification
HCC
diagnosis
Röhss, Josefine
A Statistical Framework for Classification of Tumor Type from microRNA Data
description Hepatocellular carcinoma (HCC) is a type of liver cancer with low survival rate, not least due to the difficulty of diagnosing it in an early stage. The objective of this thesis is to build a random forest classification method based on microRNA (and messenger RNA) expression profiles from patients with HCC. The main purpose is to be able to distinguish between tumor samples and normal samples by measuring the miRNA expression. If successful, this method can be used to detect HCC at an earlier stage and to design new therapeutics. The microRNAs and messenger RNAs which have a significant difference in expression between tumor samples and normal samples are selected for building random forest classification models. These models are then tested on paired samples of tumor and surrounding normal tissue from patients with HCC. The results show that the classification models built for classifying tumor and normal samples have high prediction accuracy and hence show high potential for using microRNA and messenger RNA expression levels for diagnosis of HCC. === Hepatocellulär cancer (HCC) är en typ av levercancer med mycket låg överlevnadsgrad, inte minst på grund av svårigheten att diagnosticera i ett tidigt skede. Syftet med det här projektet är att bygga en klassificeringsmodell med random forest, baserad på uttrycksprofiler av mikroRNA (och budbärar-RNA) från patienter med HCC. Målet är att kunna skilja mellan tumörprover och normala prover genom att mäta uttrycket av mikroRNA. Om detta mål uppnås kan metoden användas för att upptäcka HCC i ett tidigare skede och för att utveckla nya läkemedel. De mikroRNA och budbärar-RNA som har en signifikant skillnad i uttryck mellan prover från tumörvävnad och intilliggande normal vävnad väljs ut för att bygga klassificaringsmodeller med random forest. Dessa modeller testas sedan på parade prover av tumörvävnad och intilliggande vävnad från patienter med HCC. Resultaten visar att modeller som byggs med denna metod kan klassificera tumörprover och normala prover med hög noggrannhet. Det finns således stor potential för att använda uttrycksprofiler från mikroRNA och budbärar-RNA för att diagnosticera HCC.
author Röhss, Josefine
author_facet Röhss, Josefine
author_sort Röhss, Josefine
title A Statistical Framework for Classification of Tumor Type from microRNA Data
title_short A Statistical Framework for Classification of Tumor Type from microRNA Data
title_full A Statistical Framework for Classification of Tumor Type from microRNA Data
title_fullStr A Statistical Framework for Classification of Tumor Type from microRNA Data
title_full_unstemmed A Statistical Framework for Classification of Tumor Type from microRNA Data
title_sort statistical framework for classification of tumor type from microrna data
publisher KTH, Matematisk statistik
publishDate 2016
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-191990
work_keys_str_mv AT rohssjosefine astatisticalframeworkforclassificationoftumortypefrommicrornadata
AT rohssjosefine ettstatistisktramverkforklassificeringavtumortypfranmikrornadata
AT rohssjosefine statisticalframeworkforclassificationoftumortypefrommicrornadata
_version_ 1718382395022901248