Applications de l'apprentissage statistique à la biologie computationnelle

Les biotechnologies sont arrivées au point ou la quantité d'information disponible permet de penser les objets biologiques comme des systèmes complexes. Dans ce contexte, les phénomènes qui émergent de ces systèmes sont intimement liés aux spécificités de leur organisation. Cela pose des problè...

Full description

Bibliographic Details
Main Author: Pauwels, Edouard
Language:ENG
Published: Ecole Nationale Supérieure des Mines de Paris 2013
Subjects:
Online Access:http://pastel.archives-ouvertes.fr/pastel-00958432
http://pastel.archives-ouvertes.fr/docs/00/95/84/32/PDF/2013ENMP0052.pdf
id ndltd-CCSD-oai-pastel.archives-ouvertes.fr-pastel-00958432
record_format oai_dc
spelling ndltd-CCSD-oai-pastel.archives-ouvertes.fr-pastel-009584322014-03-13T03:25:02Z http://pastel.archives-ouvertes.fr/pastel-00958432 2013ENMP0052 http://pastel.archives-ouvertes.fr/docs/00/95/84/32/PDF/2013ENMP0052.pdf Applications de l'apprentissage statistique à la biologie computationnelle Pauwels, Edouard [SDV:SA] Life Sciences/Agricultural sciences [SDV:SA] Sciences du Vivant/Sciences agricoles Apprentissage statistique Biologie Computationnelle Conception de Médicaments Microscopie haut débit Biologie des Systèmes Les biotechnologies sont arrivées au point ou la quantité d'information disponible permet de penser les objets biologiques comme des systèmes complexes. Dans ce contexte, les phénomènes qui émergent de ces systèmes sont intimement liés aux spécificités de leur organisation. Cela pose des problèmes computationnels et statistiques qui sont précisément l'objet d'étude de la communauté liée à l'apprentissage statistique. Cette thèse traite d'applications de méthodes d'apprentissage pour l'étude de phénomène biologique dans une perspective de système complexe. Ces méthodes sont appliquées dans le cadre de l'analyse d'interactions protéine-ligand et d'effets secondaires, du phenotypage de populations de cellules et du plan d'expérience pour des systèmes dynamiques non linéaires partiellement observés.D'importantes quantités de données sont désormais disponibles concernant les molécules mises sur le marché, tels que les profils d'interactions protéiques et d'effets secondaires. Cela pose le problème d'intégrer ces données et de trouver une forme de structure sous tendant ces observations à grandes échelles. Nous appliquons des méthodes récentes d'apprentissage non supervisé à l'analyse d'importants jeux de données sur des médicaments. Des exemples illustrent la pertinence de l'information extraite qui est ensuite validée dans un contexte de prédiction.Les variations de réponses à un traitement entre différents individus posent le problème de définir l'effet d'un stimulus à l'échelle d'une population d'individus. Par exemple, dans le contexte de la microscopie à haut débit, une population de cellules est exposée à différents stimuli. Les variations d'une cellule à l'autre rendent la comparaison de différents traitement non triviale. Un modèle génératif est proposé pour attaquer ce problème et ses propriétés sont étudiées sur la base de données expérimentales.A l'échelle moléculaire, des comportements complexes émergent de cascades d'interactions non linéaires entre différentes espèces moléculaires. Ces non linéarités engendrent des problèmes d'identifiabilité du système. Elles peuvent cependant être contournées par des plans expérimentaux spécifiques, un des champs de recherche de la biologie des systèmes. Une stratégie Bayésienne itérative de plan expérimental est proposée est des résultats numériques basés sur des simulations in silico d'un réseau biologique sont présentées. 2013-11-14 ENG PhD thesis Ecole Nationale Supérieure des Mines de Paris
collection NDLTD
language ENG
sources NDLTD
topic [SDV:SA] Life Sciences/Agricultural sciences
[SDV:SA] Sciences du Vivant/Sciences agricoles
Apprentissage statistique
Biologie Computationnelle
Conception de Médicaments
Microscopie haut débit
Biologie des Systèmes
spellingShingle [SDV:SA] Life Sciences/Agricultural sciences
[SDV:SA] Sciences du Vivant/Sciences agricoles
Apprentissage statistique
Biologie Computationnelle
Conception de Médicaments
Microscopie haut débit
Biologie des Systèmes
Pauwels, Edouard
Applications de l'apprentissage statistique à la biologie computationnelle
description Les biotechnologies sont arrivées au point ou la quantité d'information disponible permet de penser les objets biologiques comme des systèmes complexes. Dans ce contexte, les phénomènes qui émergent de ces systèmes sont intimement liés aux spécificités de leur organisation. Cela pose des problèmes computationnels et statistiques qui sont précisément l'objet d'étude de la communauté liée à l'apprentissage statistique. Cette thèse traite d'applications de méthodes d'apprentissage pour l'étude de phénomène biologique dans une perspective de système complexe. Ces méthodes sont appliquées dans le cadre de l'analyse d'interactions protéine-ligand et d'effets secondaires, du phenotypage de populations de cellules et du plan d'expérience pour des systèmes dynamiques non linéaires partiellement observés.D'importantes quantités de données sont désormais disponibles concernant les molécules mises sur le marché, tels que les profils d'interactions protéiques et d'effets secondaires. Cela pose le problème d'intégrer ces données et de trouver une forme de structure sous tendant ces observations à grandes échelles. Nous appliquons des méthodes récentes d'apprentissage non supervisé à l'analyse d'importants jeux de données sur des médicaments. Des exemples illustrent la pertinence de l'information extraite qui est ensuite validée dans un contexte de prédiction.Les variations de réponses à un traitement entre différents individus posent le problème de définir l'effet d'un stimulus à l'échelle d'une population d'individus. Par exemple, dans le contexte de la microscopie à haut débit, une population de cellules est exposée à différents stimuli. Les variations d'une cellule à l'autre rendent la comparaison de différents traitement non triviale. Un modèle génératif est proposé pour attaquer ce problème et ses propriétés sont étudiées sur la base de données expérimentales.A l'échelle moléculaire, des comportements complexes émergent de cascades d'interactions non linéaires entre différentes espèces moléculaires. Ces non linéarités engendrent des problèmes d'identifiabilité du système. Elles peuvent cependant être contournées par des plans expérimentaux spécifiques, un des champs de recherche de la biologie des systèmes. Une stratégie Bayésienne itérative de plan expérimental est proposée est des résultats numériques basés sur des simulations in silico d'un réseau biologique sont présentées.
author Pauwels, Edouard
author_facet Pauwels, Edouard
author_sort Pauwels, Edouard
title Applications de l'apprentissage statistique à la biologie computationnelle
title_short Applications de l'apprentissage statistique à la biologie computationnelle
title_full Applications de l'apprentissage statistique à la biologie computationnelle
title_fullStr Applications de l'apprentissage statistique à la biologie computationnelle
title_full_unstemmed Applications de l'apprentissage statistique à la biologie computationnelle
title_sort applications de l'apprentissage statistique à la biologie computationnelle
publisher Ecole Nationale Supérieure des Mines de Paris
publishDate 2013
url http://pastel.archives-ouvertes.fr/pastel-00958432
http://pastel.archives-ouvertes.fr/docs/00/95/84/32/PDF/2013ENMP0052.pdf
work_keys_str_mv AT pauwelsedouard applicationsdelapprentissagestatistiquealabiologiecomputationnelle
_version_ 1716649222641549312