Assessment of supervised classification methods for the analysis of RNA-seq data

Les technologies « Next Generation Sequencing» (NGS), qui permettent de caractériser les séquences génomiques à un rythme sans précédent, sont utilisées pour caractériser la diversité génétique humaine et le transcriptome (partie du génome transcrite en acides ribonucléiques). Les variations du nive...

Full description

Bibliographic Details
Main Author: Abuelqumsan, Mustafa
Other Authors: Aix-Marseille
Language:en
Published: 2018
Subjects:
570
Online Access:http://www.theses.fr/2018AIXM0582/document
id ndltd-theses.fr-2018AIXM0582
record_format oai_dc
spelling ndltd-theses.fr-2018AIXM05822019-07-06T05:14:37Z Assessment of supervised classification methods for the analysis of RNA-seq data Développement, évaluation et application de méthodes statistiques pour l'analyse de données multidimensionnelles de comptage produites par les technologies de séquençage à haut débit ("Next Generation Sequencing") Bioinformatique Biostatistique Séquençage Massivement Parallèle RNA-Seq Classification supervisée Bioinformatics Biostatistics Séquençage Massivement Parallèle RNA-Seq Supervised classification 570 Les technologies « Next Generation Sequencing» (NGS), qui permettent de caractériser les séquences génomiques à un rythme sans précédent, sont utilisées pour caractériser la diversité génétique humaine et le transcriptome (partie du génome transcrite en acides ribonucléiques). Les variations du niveau d’expression des gènes selon les organes et circonstances, sous-tendent la différentiation cellulaire et la réponse aux changements d’environnement. Comme les maladies affectent souvent l’expression génique, les profils transcriptomiques peuvent servir des fins médicales (diagnostic, pronostic). Différentes méthodes d’apprentissage artificiel ont été proposées pour classer des individus sur base de données multidimensionnelles (par exemple, niveau d’expression de tous les gènes dans des d’échantillons). Pendant ma thèse, j’ai évalué des méthodes de « machine learning » afin d’optimiser la précision de la classification d’échantillons sur base de profils transcriptomiques de type RNA-seq. Since a decade, “Next Generation Sequencing” (NGS) technologies enabled to characterize genomic sequences at an unprecedented pace. Many studies focused of human genetic diversity and on transcriptome (the part of genome transcribed into ribonucleic acid). Indeed, different tissues of our body express different genes at different moments, enabling cell differentiation and functional response to environmental changes. Since many diseases affect gene expression, transcriptome profiles can be used for medical purposes (diagnostic and prognostic). A wide variety of advanced statistical and machine learning methods have been proposed to address the general problem of classifying individuals according to multiple variables (e.g. transcription level of thousands of genes in hundreds of samples). During my thesis, I led a comparative assessment of machine learning methods and their parameters, to optimize the accuracy of sample classification based on RNA-seq transcriptome profiles. Electronic Thesis or Dissertation Text en http://www.theses.fr/2018AIXM0582/document Abuelqumsan, Mustafa 2018-12-20 Aix-Marseille Van Helden, Jacques Ghattas, Badih
collection NDLTD
language en
sources NDLTD
topic Bioinformatique
Biostatistique
Séquençage Massivement Parallèle
RNA-Seq
Classification supervisée
Bioinformatics
Biostatistics
Séquençage Massivement Parallèle
RNA-Seq
Supervised classification
570
spellingShingle Bioinformatique
Biostatistique
Séquençage Massivement Parallèle
RNA-Seq
Classification supervisée
Bioinformatics
Biostatistics
Séquençage Massivement Parallèle
RNA-Seq
Supervised classification
570
Abuelqumsan, Mustafa
Assessment of supervised classification methods for the analysis of RNA-seq data
description Les technologies « Next Generation Sequencing» (NGS), qui permettent de caractériser les séquences génomiques à un rythme sans précédent, sont utilisées pour caractériser la diversité génétique humaine et le transcriptome (partie du génome transcrite en acides ribonucléiques). Les variations du niveau d’expression des gènes selon les organes et circonstances, sous-tendent la différentiation cellulaire et la réponse aux changements d’environnement. Comme les maladies affectent souvent l’expression génique, les profils transcriptomiques peuvent servir des fins médicales (diagnostic, pronostic). Différentes méthodes d’apprentissage artificiel ont été proposées pour classer des individus sur base de données multidimensionnelles (par exemple, niveau d’expression de tous les gènes dans des d’échantillons). Pendant ma thèse, j’ai évalué des méthodes de « machine learning » afin d’optimiser la précision de la classification d’échantillons sur base de profils transcriptomiques de type RNA-seq. === Since a decade, “Next Generation Sequencing” (NGS) technologies enabled to characterize genomic sequences at an unprecedented pace. Many studies focused of human genetic diversity and on transcriptome (the part of genome transcribed into ribonucleic acid). Indeed, different tissues of our body express different genes at different moments, enabling cell differentiation and functional response to environmental changes. Since many diseases affect gene expression, transcriptome profiles can be used for medical purposes (diagnostic and prognostic). A wide variety of advanced statistical and machine learning methods have been proposed to address the general problem of classifying individuals according to multiple variables (e.g. transcription level of thousands of genes in hundreds of samples). During my thesis, I led a comparative assessment of machine learning methods and their parameters, to optimize the accuracy of sample classification based on RNA-seq transcriptome profiles.
author2 Aix-Marseille
author_facet Aix-Marseille
Abuelqumsan, Mustafa
author Abuelqumsan, Mustafa
author_sort Abuelqumsan, Mustafa
title Assessment of supervised classification methods for the analysis of RNA-seq data
title_short Assessment of supervised classification methods for the analysis of RNA-seq data
title_full Assessment of supervised classification methods for the analysis of RNA-seq data
title_fullStr Assessment of supervised classification methods for the analysis of RNA-seq data
title_full_unstemmed Assessment of supervised classification methods for the analysis of RNA-seq data
title_sort assessment of supervised classification methods for the analysis of rna-seq data
publishDate 2018
url http://www.theses.fr/2018AIXM0582/document
work_keys_str_mv AT abuelqumsanmustafa assessmentofsupervisedclassificationmethodsfortheanalysisofrnaseqdata
AT abuelqumsanmustafa developpementevaluationetapplicationdemethodesstatistiquespourlanalysededonneesmultidimensionnellesdecomptageproduitesparlestechnologiesdesequencageahautdebitnextgenerationsequencing
_version_ 1719221433507250176