Algorithmes pour l'analyse de régions régulatrices dans le génome d'eucaryotes supérieurs

Les travaux présentés dans cette thèse s'inscrivent dans le cadre bio-informatique de l'analyse des génomes. Plus particulièrement, ces travaux concernent l'expression des gènes et les éléments régulateurs, présents dans l'ADN, qui participent à la modulation de cette expression....

Full description

Bibliographic Details
Main Author: Defrance, Matthieu
Language:FRE
Published: Université des Sciences et Technologie de Lille - Lille I 2006
Subjects:
ADN
Online Access:http://tel.archives-ouvertes.fr/tel-00124471
http://tel.archives-ouvertes.fr/docs/00/12/44/71/PDF/these.pdf
Description
Summary:Les travaux présentés dans cette thèse s'inscrivent dans le cadre bio-informatique de l'analyse des génomes. Plus particulièrement, ces travaux concernent l'expression des gènes et les éléments régulateurs, présents dans l'ADN, qui participent à la modulation de cette expression.<br />Le problème de la recherche de ces éléments régulateurs peut être envisagé sous l'angle informatique de la recherche de motifs approchés particuliers.<br /><br />La recherche de motifs régulateurs est une question difficile du fait de la faible spécificité des motifs recherchés. Pour pouvoir y répondre, il faut prendre en compte différentes formes d'information. En particulier, il est pertinent de prendre en compte la conservation entre espèces (génomique comparative), la conservation entre séquences génomiques partageant des éléments de régulation (gènes co-régulés) ou encore, dans certains cas, la conservation spatiale des sites de fixation.<br /><br />Dans ce cadre, nous proposons une méthode permettant de tirer parti, à la fois de la conservation spatiale, et de la conservation entre espèces. Cette approche se compose d'un algorithme de recherche locale et d'évaluateurs statistiques adaptés au problème de la recherche de motifs sur-représentés localement lorsque l'environnement de recherche est hétérogène, c'est-à-dire pour des séquences pouvant provenir d'organismes différents ou de régions différentes du génome. Ces travaux ont été mis en oeuvre dans un logiciel appelé TFM-Explorer, que nous avons évalué avec succès sur des données issues du génome humain, de la souris et du rat.