Inférence de réseaux pour modèles inflatés en zéro

L'inférence de réseaux ou inférence de graphes a de plus en plus d'applications notamment en santé humaine et en environnement pour l'étude de données micro-biologiques et génomiques. Les réseaux constituent en effet un outil approprié pour représenter, voire étudier des relations ent...

Full description

Bibliographic Details
Main Author: Karmann, Clémence
Other Authors: Université de Lorraine
Language:fr
Published: 2019
Subjects:
Online Access:http://www.theses.fr/2019LORR0146/document
id ndltd-theses.fr-2019LORR0146
record_format oai_dc
spelling ndltd-theses.fr-2019LORR01462019-12-13T03:29:24Z Inférence de réseaux pour modèles inflatés en zéro Network inference for zero-inflated models Inférence de graphes Réseaux Modèles inflatés en zéro Régression Pénalisation Lasso Sélection de variables Données gaussiennes doublement tronquées Dépendance conditionnelle Graph inference Networks Zero-inflated models Regression Lasso penalisation Variable selection Doubly truncated gaussian data Conditional dependency 519.54 L'inférence de réseaux ou inférence de graphes a de plus en plus d'applications notamment en santé humaine et en environnement pour l'étude de données micro-biologiques et génomiques. Les réseaux constituent en effet un outil approprié pour représenter, voire étudier des relations entre des entités. De nombreuses techniques mathématiques d'estimation ont été développées notamment dans le cadre des modèles graphiques gaussiens mais aussi dans le cas de données binaires ou mixtes. Le traitement des données d'abondance (de micro-organismes comme les bactéries par exemple) est particulier pour deux raisons : d'une part elles ne reflètent pas directement la réalité car un processus de séquençage a lieu pour dupliquer les espèces et ce processus apporte de la variabilité, d'autre part une espèce peut être absente dans certains échantillons. On est alors dans le cadre de données inflatées en zéro. Beaucoup de méthodes d'inférence de réseaux existent pour les données gaussiennes, les données binaires et les données mixtes mais les modèles inflatés en zéro sont très peu étudiés alors qu'ils reflètent la structure de nombreux jeux de données de façon pertinente. L'objectif de cette thèse concerne l'inférence de réseaux pour les modèles inflatés en zéro. Dans cette thèse, on se limitera à des réseaux de dépendances conditionnelles. Le travail présenté dans cette thèse se décompose principalement en deux parties. La première concerne des méthodes d'inférence de réseaux basées sur l'estimation de voisinages par une procédure couplant des méthodes de régressions ordinales et de sélection de variables. La seconde se focalise sur l'inférence de réseaux dans un modèle où les variables sont des gaussiennes inflatées en zéro par double troncature (à droite et à gauche). Network inference has more and more applications, particularly in human health and environment, for the study of micro-biological and genomic data. Networks are indeed an appropriate tool to represent, or even study, relationships between entities. Many mathematical estimation techniques have been developed, particularly in the context of Gaussian graphical models, but also in the case of binary or mixed data. The processing of abundance data (of microorganisms such as bacteria for example) is particular for two reasons: on the one hand they do not directly reflect reality because a sequencing process takes place to duplicate species and this process brings variability, on the other hand a species may be absent in some samples. We are then in the context of zero-inflated data. Many graph inference methods exist for Gaussian, binary and mixed data, but zero-inflated models are rarely studied, although they reflect the structure of many data sets in a relevant way. The objective of this thesis is to infer networks for zero-inflated models. In this thesis, we will restrict to conditional dependency graphs. The work presented in this thesis is divided into two main parts. The first one concerns graph inference methods based on the estimation of neighbourhoods by a procedure combining ordinal regression models and variable selection methods. The second one focuses on graph inference in a model where the variables are Gaussian zero-inflated by double truncation (right and left). Electronic Thesis or Dissertation Text fr http://www.theses.fr/2019LORR0146/document Karmann, Clémence 2019-11-25 Université de Lorraine Gégout-Petit, Anne Muller-Gueudin, Aurélie
collection NDLTD
language fr
sources NDLTD
topic Inférence de graphes
Réseaux
Modèles inflatés en zéro
Régression
Pénalisation Lasso
Sélection de variables
Données gaussiennes doublement tronquées
Dépendance conditionnelle
Graph inference
Networks
Zero-inflated models
Regression
Lasso penalisation
Variable selection
Doubly truncated gaussian data
Conditional dependency
519.54
spellingShingle Inférence de graphes
Réseaux
Modèles inflatés en zéro
Régression
Pénalisation Lasso
Sélection de variables
Données gaussiennes doublement tronquées
Dépendance conditionnelle
Graph inference
Networks
Zero-inflated models
Regression
Lasso penalisation
Variable selection
Doubly truncated gaussian data
Conditional dependency
519.54
Karmann, Clémence
Inférence de réseaux pour modèles inflatés en zéro
description L'inférence de réseaux ou inférence de graphes a de plus en plus d'applications notamment en santé humaine et en environnement pour l'étude de données micro-biologiques et génomiques. Les réseaux constituent en effet un outil approprié pour représenter, voire étudier des relations entre des entités. De nombreuses techniques mathématiques d'estimation ont été développées notamment dans le cadre des modèles graphiques gaussiens mais aussi dans le cas de données binaires ou mixtes. Le traitement des données d'abondance (de micro-organismes comme les bactéries par exemple) est particulier pour deux raisons : d'une part elles ne reflètent pas directement la réalité car un processus de séquençage a lieu pour dupliquer les espèces et ce processus apporte de la variabilité, d'autre part une espèce peut être absente dans certains échantillons. On est alors dans le cadre de données inflatées en zéro. Beaucoup de méthodes d'inférence de réseaux existent pour les données gaussiennes, les données binaires et les données mixtes mais les modèles inflatés en zéro sont très peu étudiés alors qu'ils reflètent la structure de nombreux jeux de données de façon pertinente. L'objectif de cette thèse concerne l'inférence de réseaux pour les modèles inflatés en zéro. Dans cette thèse, on se limitera à des réseaux de dépendances conditionnelles. Le travail présenté dans cette thèse se décompose principalement en deux parties. La première concerne des méthodes d'inférence de réseaux basées sur l'estimation de voisinages par une procédure couplant des méthodes de régressions ordinales et de sélection de variables. La seconde se focalise sur l'inférence de réseaux dans un modèle où les variables sont des gaussiennes inflatées en zéro par double troncature (à droite et à gauche). === Network inference has more and more applications, particularly in human health and environment, for the study of micro-biological and genomic data. Networks are indeed an appropriate tool to represent, or even study, relationships between entities. Many mathematical estimation techniques have been developed, particularly in the context of Gaussian graphical models, but also in the case of binary or mixed data. The processing of abundance data (of microorganisms such as bacteria for example) is particular for two reasons: on the one hand they do not directly reflect reality because a sequencing process takes place to duplicate species and this process brings variability, on the other hand a species may be absent in some samples. We are then in the context of zero-inflated data. Many graph inference methods exist for Gaussian, binary and mixed data, but zero-inflated models are rarely studied, although they reflect the structure of many data sets in a relevant way. The objective of this thesis is to infer networks for zero-inflated models. In this thesis, we will restrict to conditional dependency graphs. The work presented in this thesis is divided into two main parts. The first one concerns graph inference methods based on the estimation of neighbourhoods by a procedure combining ordinal regression models and variable selection methods. The second one focuses on graph inference in a model where the variables are Gaussian zero-inflated by double truncation (right and left).
author2 Université de Lorraine
author_facet Université de Lorraine
Karmann, Clémence
author Karmann, Clémence
author_sort Karmann, Clémence
title Inférence de réseaux pour modèles inflatés en zéro
title_short Inférence de réseaux pour modèles inflatés en zéro
title_full Inférence de réseaux pour modèles inflatés en zéro
title_fullStr Inférence de réseaux pour modèles inflatés en zéro
title_full_unstemmed Inférence de réseaux pour modèles inflatés en zéro
title_sort inférence de réseaux pour modèles inflatés en zéro
publishDate 2019
url http://www.theses.fr/2019LORR0146/document
work_keys_str_mv AT karmannclemence inferencedereseauxpourmodelesinflatesenzero
AT karmannclemence networkinferenceforzeroinflatedmodels
_version_ 1719303295640535040