Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.

L'analyse bioinformatique des données de transcriptomique a pour but d'identifier les gènes qui présentent des variations d'expression entre différentes situations, par exemple entre des échantillons de tissu sain et de tissu malade et de caractériser ces gènes à partir de leurs annot...

Full description

Bibliographic Details
Main Author: Benabderrahmane, Sidahmed
Language:FRE
Published: Université Henri Poincaré - Nancy I 2011
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00653169
http://tel.archives-ouvertes.fr/docs/00/65/98/84/PDF/Benabderrahmane_sidahmed_PHD_2011.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00653169
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006531692013-01-07T17:19:12Z http://tel.archives-ouvertes.fr/tel-00653169 http://tel.archives-ouvertes.fr/docs/00/65/98/84/PDF/Benabderrahmane_sidahmed_PHD_2011.pdf Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal. Benabderrahmane, Sidahmed [INFO:INFO_AI] Computer Science/Artificial Intelligence [INFO:INFO_BI] Computer Science/Bioinformatics [SDV:BIBS] Life Sciences/Quantitative Methods [INFO:INFO_LG] Computer Science/Learning Données transcriptomiques Cancer colorectal Ontologie GO Mesure de similarité sémantique Graphe acyclique dirigé enraciné Classification fonctionnelle de gènes Profils d'expression Réduction d'attributs L'analyse bioinformatique des données de transcriptomique a pour but d'identifier les gènes qui présentent des variations d'expression entre différentes situations, par exemple entre des échantillons de tissu sain et de tissu malade et de caractériser ces gènes à partir de leurs annotations fonctionnelles. Dans ce travail de thèse, je propose quatre contributions pour la prise en compte des connaissances du domaine dans ces méthodes. Tout d'abord je définis une nouvelle mesure de similarité sémantique et fonctionnelle (IntelliGO) entre les gènes, qui exploite au mieux les annotations fonctionnelles issues de l'ontologie GO ('Gene Ontology'). Je montre ensuite, grâce à une méthodologie d'évaluation rigoureuse, que la mesure IntelliGO est performante pour la classification fonctionnelle des gènes. En troisième contribution je propose une approche différentielle avec affectation floue pour la construction de profils d'expression différentielle (PED). Je définis alors un algorithme d'analyse de recouvrement entre classes fonctionnelles et ensemble des références, ici les PEDs, pour mettre en évidence des gènes ayant à la fois les mêmes variations d'expression et des annotations fonctionnelles similaires. Cette méthode est appliquée à des données expérimentales produites à partir d'échantillons de tissus sains, de tumeur colo-rectale et de lignée cellulaire cancéreuse. Finalement, la mesure de similarité IntelliGO est généralisée à d'autres vocabulaires structurés en graphe acyclique dirigé et enraciné (rDAG) comme l'est l'ontologie GO, avec un exemple d'application concernant la réduction sémantique d'attributs avant la fouille. 2011-12-15 FRE PhD thesis Université Henri Poincaré - Nancy I
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_AI] Computer Science/Artificial Intelligence
[INFO:INFO_BI] Computer Science/Bioinformatics
[SDV:BIBS] Life Sciences/Quantitative Methods
[INFO:INFO_LG] Computer Science/Learning
Données transcriptomiques
Cancer colorectal
Ontologie GO
Mesure de similarité sémantique
Graphe acyclique dirigé enraciné
Classification fonctionnelle de gènes
Profils d'expression
Réduction d'attributs
spellingShingle [INFO:INFO_AI] Computer Science/Artificial Intelligence
[INFO:INFO_BI] Computer Science/Bioinformatics
[SDV:BIBS] Life Sciences/Quantitative Methods
[INFO:INFO_LG] Computer Science/Learning
Données transcriptomiques
Cancer colorectal
Ontologie GO
Mesure de similarité sémantique
Graphe acyclique dirigé enraciné
Classification fonctionnelle de gènes
Profils d'expression
Réduction d'attributs
Benabderrahmane, Sidahmed
Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.
description L'analyse bioinformatique des données de transcriptomique a pour but d'identifier les gènes qui présentent des variations d'expression entre différentes situations, par exemple entre des échantillons de tissu sain et de tissu malade et de caractériser ces gènes à partir de leurs annotations fonctionnelles. Dans ce travail de thèse, je propose quatre contributions pour la prise en compte des connaissances du domaine dans ces méthodes. Tout d'abord je définis une nouvelle mesure de similarité sémantique et fonctionnelle (IntelliGO) entre les gènes, qui exploite au mieux les annotations fonctionnelles issues de l'ontologie GO ('Gene Ontology'). Je montre ensuite, grâce à une méthodologie d'évaluation rigoureuse, que la mesure IntelliGO est performante pour la classification fonctionnelle des gènes. En troisième contribution je propose une approche différentielle avec affectation floue pour la construction de profils d'expression différentielle (PED). Je définis alors un algorithme d'analyse de recouvrement entre classes fonctionnelles et ensemble des références, ici les PEDs, pour mettre en évidence des gènes ayant à la fois les mêmes variations d'expression et des annotations fonctionnelles similaires. Cette méthode est appliquée à des données expérimentales produites à partir d'échantillons de tissus sains, de tumeur colo-rectale et de lignée cellulaire cancéreuse. Finalement, la mesure de similarité IntelliGO est généralisée à d'autres vocabulaires structurés en graphe acyclique dirigé et enraciné (rDAG) comme l'est l'ontologie GO, avec un exemple d'application concernant la réduction sémantique d'attributs avant la fouille.
author Benabderrahmane, Sidahmed
author_facet Benabderrahmane, Sidahmed
author_sort Benabderrahmane, Sidahmed
title Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.
title_short Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.
title_full Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.
title_fullStr Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.
title_full_unstemmed Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous. Application au cancer colorectal.
title_sort prise en compte des connaissances du domaine dans l'analyse transcriptomique : similarité sémantique, classification fonctionnelle et profils flous. application au cancer colorectal.
publisher Université Henri Poincaré - Nancy I
publishDate 2011
url http://tel.archives-ouvertes.fr/tel-00653169
http://tel.archives-ouvertes.fr/docs/00/65/98/84/PDF/Benabderrahmane_sidahmed_PHD_2011.pdf
work_keys_str_mv AT benabderrahmanesidahmed priseencomptedesconnaissancesdudomainedanslanalysetranscriptomiquesimilaritesemantiqueclassificationfonctionnelleetprofilsflousapplicationaucancercolorectal
_version_ 1716395873429094400