Proposition d’une stratégie d’analyse statistique des données de puces à ADN décrivant une cinétique d’expression génique

Les résultats d’expériences de microarray furent décriés par le manque de concordance inter-expériences. Les listes immenses de gènes résultant de filtrages statistiques sont difficiles à exploiter. La Food and Drug Administration a montré que le choix d’indicateurs de filtrage de gènes était la sou...

Full description

Bibliographic Details
Main Author: Tourlet, Sébastien
Other Authors: Tours
Language:fr
Published: 2009
Subjects:
Online Access:http://www.theses.fr/2009TOUR3134
Description
Summary:Les résultats d’expériences de microarray furent décriés par le manque de concordance inter-expériences. Les listes immenses de gènes résultant de filtrages statistiques sont difficiles à exploiter. La Food and Drug Administration a montré que le choix d’indicateurs de filtrage de gènes était la source d’une grande disparité entre expériences de microarray issus de laboratoires indépendants. Dans ce contexte, nous avons développé une méthode de sélection basée sur la modélisation de l’allure de la courbe d’expression avec le Log2 du « fold-change » entre les points de cinétique. En effet, des gènes co-régulés au cours d’une cinétique temporelle présentent des courbes d’expression d’allure similaire alors que leur niveau d’expression peut être différent. Nous avons validé la méthode grâce à 2 expériences indépendantes de microar-ray étudiant la différenciation des ovaires d’embryons de souris. Ainsi, nous avons obtenu une liste réduite et pertinente de gènes exprimés. Puis, une analyse de ces résultats dans le cas de la différenciation ovarienne nous a permis d’identifier 9 nouveaux gènes candidats validés in silico et restant à être testés biologiquement. === Microarray results were blamed because of their lack of concordance. Moreover, the huge candidate gene lists from statistical filterings are not useful for biologists. FDA proved that the lack of reliability between microarray experiments came from the choice of gene filtering indicators. In this context, a filtering method was developed based on expression curve shape modelling with the use of Log 2 of fold-change between kinetic points. Actually, the co-regulated genes display similar expression shape but with heterogeneous expression level.Our method was developed and validated thanks to two independent microarray experiments (Affymetric®) from mouse embryonic ovaries. Therefore, a short and relevant list of genes was obtained. Thus, a study of results linked to ovarian differentiation permitted to identify nine new candidate genes that were in silico validated. These genes might be biologically tested (i.e. RT PCR) by the scientific community.