Summary: | Dans cette thèse, nous nous intéressons à la modélisation statistique de données biologiques, et plus particulièrement à l'étude de l'information génétique et protéique.Dans un premier volet, nous avons amélioré un modèle statistique des données immunologiques existant chez la souris, que nous avons transposé à l'homme, afin d'étudier les différentes recombinaisons qui apparaissent au sein du thymus, à la fin de la vie embryonnaire, entre les segments des gènes de la portion V(D)J du chromosome 14 humain, appelées recombinaisons V(D)J.Dans un deuxième volet, nous avons étudié l'information génétique par le biais des réseaux de régulations génétique, celui de la maladie familiale « atrésie biliaire », ainsi que dans les réseaux de contrôle du système immunitaire, que nous avons appelés « Immunetworks ».Dans un troisième volet, nous proposons une nouvelle approche de la compression des données biologiques, qui intègre une étape de modélisation des processus dynamiques qui leur ont donné naissance : nous avons appelé cette approche la transformée Dynalet et nous l'appliquons, entre autres, à des signaux de spectrométrie RMN (Résonance Magnétique Nucléaire) des protéines et acides nucléiques. Cette méthode consiste à convertir les signaux de spectrométrie en sons, afin de construire une lutherie anharmonique permettant de reproduire les pics de relaxation périodisés, issus des spectres RMN des 20 acides aminés, ainsi que de ceux des 4 bases nucléiques azotées. === In this thesis, we focus on statistical modeling of biological data, and more particularly on the study of genetic and protein information.First, we have improved a statistical model of existing immunological data in mice, we have transposed it to human, in order to study the various recombinations that occur within the thymus, at the end of the embryonic life, between segments of genes from the portion V (D) J of the human chromosome 14, called recombinations V (D) J.Secondly, we studied the genetic information through genetic regulatory networks, for example in the case of a family illness called the "biliary atresia," as well as in the immune system control networks, which we have called "Immunetworks".In a last part, we propose a new approach for biological data compression, which includes a step of modeling the dynamic processes that gave rise to them: we call this approach the "Dynalet" transform and we apply it, among others, to NMR spectrometry signals, i.e., Nuclear Magnetic Resonance spectra of proteins and nucleic acids. This method consists in converting the peaks of the spectrometric signals into sounds, in order to construct an anharmonic instrument capable to reproduce periodized relaxation peaks from the NMR spectra of the 20 amino acids, as well as those of the 4 nucleic bases.
|