Le transcriptome : un domaine d'application pour les<br />statistiques, de nouveaux horizons pour la biologie

Les mesures des niveaux d'expression de tous les gènes d'un génome requièrent une analyse<br />statistique afin d'obtenir des conclusions fiables. Les biologistes ont du mal à faire un choix dans la<br />foule de méthodes existantes. Afin de déterminer quelle méthode est l...

Full description

Bibliographic Details
Main Author: Carpentier, Anne-Sophie
Language:FRE
Published: Université d'Evry-Val d'Essonne 2006
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00067855
http://tel.archives-ouvertes.fr/docs/00/06/78/55/PDF/these.pdf
Description
Summary:Les mesures des niveaux d'expression de tous les gènes d'un génome requièrent une analyse<br />statistique afin d'obtenir des conclusions fiables. Les biologistes ont du mal à faire un choix dans la<br />foule de méthodes existantes. Afin de déterminer quelle méthode est la plus adéquate pour la<br />problématique abordée, des comparaisons de méthodes d'analyse disponibles sont nécessaires.<br />Actuellement les critères de comparaison se révèlent soit lacunaires ou soit non pertinents du point de<br />vue biologique.<br />Nous avons introduit un nouveau critère biologique de comparaison des méthodes d'analyse du<br />transcriptome fondé sur une structure des génomes bactériens : les opérons. Les gènes d'un opéron<br />sont généralement transcrits sur un même ARNm. Si un gène d'un opéron bactérien est identifié, les<br />autres gènes de l'opéron devraient l'être également. Nous avons ainsi comparé des méthodes<br />d'analyse appliquées au transcriptome : l'ACP et l'ACI, respectivement analyses en composantes<br />principales et indépendantes, l'ANOVA, analyse de variance, la régression des moindres carrés<br />partiels PLS et différents t-tests. Chaque méthode aborde le nuage de données d'un point de vue<br />différent ce qui donne des résultats complémentaires. Globalement, l'ACI a fourni les meilleurs<br />résultats tant en sensibilité qu'en terme de précision.<br />Un autre aspect, en plein développement, de l'analyse du transcriptome est la méta-analyse de<br />données d'origines diverses malgré les biais inhérents à cette technologie. Généralement ces métaanalyses<br />visent à préciser les résultats concernant des gènes différentiellement exprimés ou coexprimés.<br />Elles ouvrent également la possibilité d'étudier de nouveaux champs en biologie. Nous<br />avons utilisé des données de transcriptome indépendantes afin d'étudier l'organisation de l'expression<br />des gènes et, ainsi, celle du chromosome bactérien. L'étude du transcriptome de trois bactéries, B.<br />subtilis, E. coli et S. meliloti a révélé des corrélations d'expression à longue distance valables quel que<br />soit le gène étudié. Les structures en opéron se manifestent clairement au travers de cette étude, qui<br />a également permis de préciser que la co-expression de gènes proches s'étend au-delà des opérons<br />dans une région qui se répand jusqu'à une centaine de gènes.<br />Pour conclure, l'analyse du transcriptome n'a pas réellement nécessité la mise au point de méthodes<br />d'analyse statistiques spécifiques. Cependant, elle permet d'aborder de nouveaux horizons dans la<br />biologie, et notamment l'organisation chromosomique du génome bactérien.