Applications de l'apprentissage statistique à la biologie computationnelle
Les biotechnologies sont arrivées au point ou la quantité d'information disponible permet de penser les objets biologiques comme des systèmes complexes. Dans ce contexte, les phénomènes qui émergent de ces systèmes sont intimement liés aux spécificités de leur organisation. Cela pose des problè...
Main Author: | |
---|---|
Language: | ENG |
Published: |
Ecole Nationale Supérieure des Mines de Paris
2013
|
Subjects: | |
Online Access: | http://pastel.archives-ouvertes.fr/pastel-00958432 http://pastel.archives-ouvertes.fr/docs/00/95/84/32/PDF/2013ENMP0052.pdf |
id |
ndltd-CCSD-oai-pastel.archives-ouvertes.fr-pastel-00958432 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-pastel.archives-ouvertes.fr-pastel-009584322014-03-13T03:25:02Z http://pastel.archives-ouvertes.fr/pastel-00958432 2013ENMP0052 http://pastel.archives-ouvertes.fr/docs/00/95/84/32/PDF/2013ENMP0052.pdf Applications de l'apprentissage statistique à la biologie computationnelle Pauwels, Edouard [SDV:SA] Life Sciences/Agricultural sciences [SDV:SA] Sciences du Vivant/Sciences agricoles Apprentissage statistique Biologie Computationnelle Conception de Médicaments Microscopie haut débit Biologie des Systèmes Les biotechnologies sont arrivées au point ou la quantité d'information disponible permet de penser les objets biologiques comme des systèmes complexes. Dans ce contexte, les phénomènes qui émergent de ces systèmes sont intimement liés aux spécificités de leur organisation. Cela pose des problèmes computationnels et statistiques qui sont précisément l'objet d'étude de la communauté liée à l'apprentissage statistique. Cette thèse traite d'applications de méthodes d'apprentissage pour l'étude de phénomène biologique dans une perspective de système complexe. Ces méthodes sont appliquées dans le cadre de l'analyse d'interactions protéine-ligand et d'effets secondaires, du phenotypage de populations de cellules et du plan d'expérience pour des systèmes dynamiques non linéaires partiellement observés.D'importantes quantités de données sont désormais disponibles concernant les molécules mises sur le marché, tels que les profils d'interactions protéiques et d'effets secondaires. Cela pose le problème d'intégrer ces données et de trouver une forme de structure sous tendant ces observations à grandes échelles. Nous appliquons des méthodes récentes d'apprentissage non supervisé à l'analyse d'importants jeux de données sur des médicaments. Des exemples illustrent la pertinence de l'information extraite qui est ensuite validée dans un contexte de prédiction.Les variations de réponses à un traitement entre différents individus posent le problème de définir l'effet d'un stimulus à l'échelle d'une population d'individus. Par exemple, dans le contexte de la microscopie à haut débit, une population de cellules est exposée à différents stimuli. Les variations d'une cellule à l'autre rendent la comparaison de différents traitement non triviale. Un modèle génératif est proposé pour attaquer ce problème et ses propriétés sont étudiées sur la base de données expérimentales.A l'échelle moléculaire, des comportements complexes émergent de cascades d'interactions non linéaires entre différentes espèces moléculaires. Ces non linéarités engendrent des problèmes d'identifiabilité du système. Elles peuvent cependant être contournées par des plans expérimentaux spécifiques, un des champs de recherche de la biologie des systèmes. Une stratégie Bayésienne itérative de plan expérimental est proposée est des résultats numériques basés sur des simulations in silico d'un réseau biologique sont présentées. 2013-11-14 ENG PhD thesis Ecole Nationale Supérieure des Mines de Paris |
collection |
NDLTD |
language |
ENG |
sources |
NDLTD |
topic |
[SDV:SA] Life Sciences/Agricultural sciences [SDV:SA] Sciences du Vivant/Sciences agricoles Apprentissage statistique Biologie Computationnelle Conception de Médicaments Microscopie haut débit Biologie des Systèmes |
spellingShingle |
[SDV:SA] Life Sciences/Agricultural sciences [SDV:SA] Sciences du Vivant/Sciences agricoles Apprentissage statistique Biologie Computationnelle Conception de Médicaments Microscopie haut débit Biologie des Systèmes Pauwels, Edouard Applications de l'apprentissage statistique à la biologie computationnelle |
description |
Les biotechnologies sont arrivées au point ou la quantité d'information disponible permet de penser les objets biologiques comme des systèmes complexes. Dans ce contexte, les phénomènes qui émergent de ces systèmes sont intimement liés aux spécificités de leur organisation. Cela pose des problèmes computationnels et statistiques qui sont précisément l'objet d'étude de la communauté liée à l'apprentissage statistique. Cette thèse traite d'applications de méthodes d'apprentissage pour l'étude de phénomène biologique dans une perspective de système complexe. Ces méthodes sont appliquées dans le cadre de l'analyse d'interactions protéine-ligand et d'effets secondaires, du phenotypage de populations de cellules et du plan d'expérience pour des systèmes dynamiques non linéaires partiellement observés.D'importantes quantités de données sont désormais disponibles concernant les molécules mises sur le marché, tels que les profils d'interactions protéiques et d'effets secondaires. Cela pose le problème d'intégrer ces données et de trouver une forme de structure sous tendant ces observations à grandes échelles. Nous appliquons des méthodes récentes d'apprentissage non supervisé à l'analyse d'importants jeux de données sur des médicaments. Des exemples illustrent la pertinence de l'information extraite qui est ensuite validée dans un contexte de prédiction.Les variations de réponses à un traitement entre différents individus posent le problème de définir l'effet d'un stimulus à l'échelle d'une population d'individus. Par exemple, dans le contexte de la microscopie à haut débit, une population de cellules est exposée à différents stimuli. Les variations d'une cellule à l'autre rendent la comparaison de différents traitement non triviale. Un modèle génératif est proposé pour attaquer ce problème et ses propriétés sont étudiées sur la base de données expérimentales.A l'échelle moléculaire, des comportements complexes émergent de cascades d'interactions non linéaires entre différentes espèces moléculaires. Ces non linéarités engendrent des problèmes d'identifiabilité du système. Elles peuvent cependant être contournées par des plans expérimentaux spécifiques, un des champs de recherche de la biologie des systèmes. Une stratégie Bayésienne itérative de plan expérimental est proposée est des résultats numériques basés sur des simulations in silico d'un réseau biologique sont présentées. |
author |
Pauwels, Edouard |
author_facet |
Pauwels, Edouard |
author_sort |
Pauwels, Edouard |
title |
Applications de l'apprentissage statistique à la biologie computationnelle |
title_short |
Applications de l'apprentissage statistique à la biologie computationnelle |
title_full |
Applications de l'apprentissage statistique à la biologie computationnelle |
title_fullStr |
Applications de l'apprentissage statistique à la biologie computationnelle |
title_full_unstemmed |
Applications de l'apprentissage statistique à la biologie computationnelle |
title_sort |
applications de l'apprentissage statistique à la biologie computationnelle |
publisher |
Ecole Nationale Supérieure des Mines de Paris |
publishDate |
2013 |
url |
http://pastel.archives-ouvertes.fr/pastel-00958432 http://pastel.archives-ouvertes.fr/docs/00/95/84/32/PDF/2013ENMP0052.pdf |
work_keys_str_mv |
AT pauwelsedouard applicationsdelapprentissagestatistiquealabiologiecomputationnelle |
_version_ |
1716649222641549312 |