Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome

Les études d'association sur un génome complet (GWAS) sont conçues pour découvrir les combinaisons de points de polymorphisme (SNP) associées à des maladies. La découverte de ces associations permet d'élaborer de meilleures stratégies pour détecter, traiter ou prévenir les maladies. Récemm...

Full description

Bibliographic Details
Main Author: Pham, Hoang Son
Other Authors: Rennes 1
Language:en
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017REN1S074/document
id ndltd-theses.fr-2017REN1S074
record_format oai_dc
spelling ndltd-theses.fr-2017REN1S0742018-02-16T04:16:28Z Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome Novel pattern mining techniques for genome-wide association studies Étude d'association à l'échelle du génome Patterns discriminatifs Visualisation Mesure de la force d'association Genome-Wide association studies Single-Nucleotide polymorphism Discriminative pattern Association strength measure Visualization Les études d'association sur un génome complet (GWAS) sont conçues pour découvrir les combinaisons de points de polymorphisme (SNP) associées à des maladies. La découverte de ces associations permet d'élaborer de meilleures stratégies pour détecter, traiter ou prévenir les maladies. Récemment, l'utilisation de techniques d'extraction de patterns discriminatif a été investiguée dans le cadre de problématiques GWAS. Toutefois, la découverte de combinaisons de SNP dans de grands jeux de données GWAS est encore difficile à cause de la complexité des algorithmes utilisés. La thèse se propose donc d'améliorer l'état de l'art des approches d'extraction de motifs discriminants, dans le cadre d'extraction de combinaisons de SNP corrélées à un phénotype d'intérêt. Plusieurs solutions ont été proposées, s'attaquant aux problèmes majeurs en GWAS : évaluation de la force d'association, découverte efficace de combinaisons de SNP et visualisation de ces combinaisons. Les approches proposées sont également prometteuses pour d'autres tâches de bioinformatique comme la découverte d'expressions génique, la détection de motifs de phosphorylation et la détection de motifs de régulation. Discovering high-order SNP combinations associated with diseases is an important task of bioinformatics. Once new genetic associations are identified, they can be used to develop better trategies to detect, treat and prevent the diseases. Recently, this issue has been effectively tackled with discriminative pattern mining algorithms. However, the number of SNPs is often very large, discovering of SNP combinations remains many challenges. To address these challenges this thesis has been advanced the state-of-the-art discriminative pattern mining techniques to discover SNP combinations associated with interesting phenotype. Different solutions have been proposed in this thesis to tackle GWAS analysis. These solutions focus on efficient association strength evaluation, statistically significant discriminative SNP combinations discovery and interesting SNP combinations visualization. The solutions proposed in this thesis are also promising for other tasks of bioinformatics such as differential gene expression discovery, phosphorylation motifs detection and regulatory motif combination mining. Electronic Thesis or Dissertation Text en http://www.theses.fr/2017REN1S074/document Pham, Hoang Son 2017-12-22 Rennes 1 Rennes 1 Lavenier, Dominique Termier, Alexandre
collection NDLTD
language en
sources NDLTD
topic Étude d'association à l'échelle du génome
Patterns discriminatifs
Visualisation
Mesure de la force d'association
Genome-Wide association studies
Single-Nucleotide polymorphism
Discriminative pattern
Association strength measure
Visualization

spellingShingle Étude d'association à l'échelle du génome
Patterns discriminatifs
Visualisation
Mesure de la force d'association
Genome-Wide association studies
Single-Nucleotide polymorphism
Discriminative pattern
Association strength measure
Visualization

Pham, Hoang Son
Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
description Les études d'association sur un génome complet (GWAS) sont conçues pour découvrir les combinaisons de points de polymorphisme (SNP) associées à des maladies. La découverte de ces associations permet d'élaborer de meilleures stratégies pour détecter, traiter ou prévenir les maladies. Récemment, l'utilisation de techniques d'extraction de patterns discriminatif a été investiguée dans le cadre de problématiques GWAS. Toutefois, la découverte de combinaisons de SNP dans de grands jeux de données GWAS est encore difficile à cause de la complexité des algorithmes utilisés. La thèse se propose donc d'améliorer l'état de l'art des approches d'extraction de motifs discriminants, dans le cadre d'extraction de combinaisons de SNP corrélées à un phénotype d'intérêt. Plusieurs solutions ont été proposées, s'attaquant aux problèmes majeurs en GWAS : évaluation de la force d'association, découverte efficace de combinaisons de SNP et visualisation de ces combinaisons. Les approches proposées sont également prometteuses pour d'autres tâches de bioinformatique comme la découverte d'expressions génique, la détection de motifs de phosphorylation et la détection de motifs de régulation. === Discovering high-order SNP combinations associated with diseases is an important task of bioinformatics. Once new genetic associations are identified, they can be used to develop better trategies to detect, treat and prevent the diseases. Recently, this issue has been effectively tackled with discriminative pattern mining algorithms. However, the number of SNPs is often very large, discovering of SNP combinations remains many challenges. To address these challenges this thesis has been advanced the state-of-the-art discriminative pattern mining techniques to discover SNP combinations associated with interesting phenotype. Different solutions have been proposed in this thesis to tackle GWAS analysis. These solutions focus on efficient association strength evaluation, statistically significant discriminative SNP combinations discovery and interesting SNP combinations visualization. The solutions proposed in this thesis are also promising for other tasks of bioinformatics such as differential gene expression discovery, phosphorylation motifs detection and regulatory motif combination mining.
author2 Rennes 1
author_facet Rennes 1
Pham, Hoang Son
author Pham, Hoang Son
author_sort Pham, Hoang Son
title Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
title_short Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
title_full Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
title_fullStr Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
title_full_unstemmed Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
title_sort nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
publishDate 2017
url http://www.theses.fr/2017REN1S074/document
work_keys_str_mv AT phamhoangson nouvellestechniquesdextractiondemotifpourletudedassociationalechelledugenome
AT phamhoangson novelpatternminingtechniquesforgenomewideassociationstudies
_version_ 1718614513331208192