Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique

Parmi les paramètres influençant l'inférence d'arbres phylogénétiques, nous nous sommes penchés d'une part sur (i) l'utilisation et l'efficacité de différents marqueurs et (ii) l'influence de la radiation évolutive (la succession rapide d'événements de spéciation)...

Full description

Bibliographic Details
Main Author: Gatto, Laurent
Other Authors: Van Helden, Jacques
Format: Others
Language:fr
Published: Universite Libre de Bruxelles 2006
Subjects:
GTR
Online Access:http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/
id ndltd-BICfB-oai-ulb.ac.be-ETDULB-ULBetd-07112006-210348
record_format oai_dc
collection NDLTD
language fr
format Others
sources NDLTD
topic homoplasie
SINE
tri différentiel des lignées généalogique
rétroposon
évolution
biologie évolutive
phylogénie
marqueurs phylogénétique
GTR
spellingShingle homoplasie
SINE
tri différentiel des lignées généalogique
rétroposon
évolution
biologie évolutive
phylogénie
marqueurs phylogénétique
GTR
Gatto, Laurent
Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
description Parmi les paramètres influençant l'inférence d'arbres phylogénétiques, nous nous sommes penchés d'une part sur (i) l'utilisation et l'efficacité de différents marqueurs et (ii) l'influence de la radiation évolutive (la succession rapide d'événements de spéciation) dans la construction d'arbres phylogénétiques et, d'autre part, sur l'applicabilité du modèle de substitution nucléotidique GTR (General Time Reversible). La première partie de ce travail étudie l'évolution des cétacés en se basant sur les séquences des génomes mitochondriaux, sur le motif d'insertion de rétroposons SINEs (short interspersed elements) nouvellement isolés et les loci nucléaires de ces derniers. Le choix des cétacés est motivé par la présence, durant leur évolution, de radiations évolutives, qui sont propices au tri différentiel de lignées généalogiques: si des séquences de gènes ou des allèles restent polymorphes entre des événements de spéciations, il est possible, et même probable, d'observer une incompatibilité entre les histoires évolutives de ces marqueurs, malgré que celles-ci soient bien correctes. Nous abordons l'étude du tri différentiel des lignées généalogiques par le biais des SINEs, dont l'insertion aléatoire et irréversible confère à ces marqueurs un risque de convergence particulièrement faible. Notre approche multi-marqueur nous permet de reconstruire un arbre robuste à partir duquel nous analysons ces différents marqueurs à l'aide des rapports signal/bruit (la qualité du contenu informatif du marqueur) et effort/signal (les efforts à mettre en oeuvre pour obtenir du signal phylogénétique). Nous discutons également les relations conflictuelles/incorrectes obtenues à partir des différents marqueurs, notamment des motifs d'insertion de SINEs pour lesquels nous décrivons un test objectif nous permettant de différencier le tri différentiel de lignées généalogiques et la convergence. Les modèles de substitutions nucléotidiques sont à la base de nombreuses méthodes d'inférence phylogénétiques. Parmi ces modèles, le modèle GTR est un des plus complets et des plus utilisés. Waddell and Steel [1997] ont décrit une procédure qui permet d'estimer les distances et les taux instantanés de substitution pour des séquences évoluant selon les hypothèses du modèle GTR. Il existe néanmoins des conditions qui rendent cette procédure, et donc l'utilisation du modèle GTR, inapplicables. Nous avons simulé l'évolution de séquences d'ADN le long de 12 arbres caractérisés par un ensemble de conditions biologiquement plausibles (différentes longueurs de branches, des conditions de (non-)homogénéité de la matrice de taux instantanés de substitution et différentes longueurs de séquences). Pour chaque ensemble de conditions, nous avons évalué (i) l'applicabilité du modèle GTR et (ii) la qualité des alignements obtenus à partir des données simulées. Nos résultats indiquent que l'inapplicabilité de la procédure de Waddell and Steel [1997] peut effectivement être considérée comme un problème pratique car elle apparaît avant les difficultés d'alignement (étape nécessaire et préalable à toute inférence phylogénétique). La probabilité de cette inapplicabilité dépend du taux de substitution et de la taille des données.
author2 Van Helden, Jacques
author_facet Van Helden, Jacques
Gatto, Laurent
author Gatto, Laurent
author_sort Gatto, Laurent
title Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
title_short Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
title_full Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
title_fullStr Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
title_full_unstemmed Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
title_sort comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
publisher Universite Libre de Bruxelles
publishDate 2006
url http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/
work_keys_str_mv AT gattolaurent comparaisondelutiliteetdelefficacitededifferentsmarqueursmoleculairesadesfinsdinferencephylogenetique
_version_ 1716393987394240512
spelling ndltd-BICfB-oai-ulb.ac.be-ETDULB-ULBetd-07112006-2103482013-01-07T15:42:57Z Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique Gatto, Laurent homoplasie SINE tri différentiel des lignées généalogique rétroposon évolution biologie évolutive phylogénie marqueurs phylogénétique GTR Parmi les paramètres influençant l'inférence d'arbres phylogénétiques, nous nous sommes penchés d'une part sur (i) l'utilisation et l'efficacité de différents marqueurs et (ii) l'influence de la radiation évolutive (la succession rapide d'événements de spéciation) dans la construction d'arbres phylogénétiques et, d'autre part, sur l'applicabilité du modèle de substitution nucléotidique GTR (General Time Reversible). La première partie de ce travail étudie l'évolution des cétacés en se basant sur les séquences des génomes mitochondriaux, sur le motif d'insertion de rétroposons SINEs (short interspersed elements) nouvellement isolés et les loci nucléaires de ces derniers. Le choix des cétacés est motivé par la présence, durant leur évolution, de radiations évolutives, qui sont propices au tri différentiel de lignées généalogiques: si des séquences de gènes ou des allèles restent polymorphes entre des événements de spéciations, il est possible, et même probable, d'observer une incompatibilité entre les histoires évolutives de ces marqueurs, malgré que celles-ci soient bien correctes. Nous abordons l'étude du tri différentiel des lignées généalogiques par le biais des SINEs, dont l'insertion aléatoire et irréversible confère à ces marqueurs un risque de convergence particulièrement faible. Notre approche multi-marqueur nous permet de reconstruire un arbre robuste à partir duquel nous analysons ces différents marqueurs à l'aide des rapports signal/bruit (la qualité du contenu informatif du marqueur) et effort/signal (les efforts à mettre en oeuvre pour obtenir du signal phylogénétique). Nous discutons également les relations conflictuelles/incorrectes obtenues à partir des différents marqueurs, notamment des motifs d'insertion de SINEs pour lesquels nous décrivons un test objectif nous permettant de différencier le tri différentiel de lignées généalogiques et la convergence. Les modèles de substitutions nucléotidiques sont à la base de nombreuses méthodes d'inférence phylogénétiques. Parmi ces modèles, le modèle GTR est un des plus complets et des plus utilisés. Waddell and Steel [1997] ont décrit une procédure qui permet d'estimer les distances et les taux instantanés de substitution pour des séquences évoluant selon les hypothèses du modèle GTR. Il existe néanmoins des conditions qui rendent cette procédure, et donc l'utilisation du modèle GTR, inapplicables. Nous avons simulé l'évolution de séquences d'ADN le long de 12 arbres caractérisés par un ensemble de conditions biologiquement plausibles (différentes longueurs de branches, des conditions de (non-)homogénéité de la matrice de taux instantanés de substitution et différentes longueurs de séquences). Pour chaque ensemble de conditions, nous avons évalué (i) l'applicabilité du modèle GTR et (ii) la qualité des alignements obtenus à partir des données simulées. Nos résultats indiquent que l'inapplicabilité de la procédure de Waddell and Steel [1997] peut effectivement être considérée comme un problème pratique car elle apparaît avant les difficultés d'alignement (étape nécessaire et préalable à toute inférence phylogénétique). La probabilité de cette inapplicabilité dépend du taux de substitution et de la taille des données. Van Helden, Jacques Pontarotti, Pierre Milinkovitch, Michel C. Roscam-Szpirer, Josiane Urbain, Jacques Universite Libre de Bruxelles 2006-07-27 text application/pdf http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/ http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/ fr unrestricted J'accepte que le texte de la thèse (ci-après l'oeuvre), sous réserve des parties couvertes par la confidentialité, soit publié dans le recueil électronique des thèses ULB. A cette fin, je donne licence à ULB : - le droit de fixer et de reproduire l'oeuvre sur support électronique : logiciel ETD/db - le droit de communiquer l'oeuvre au public Cette licence, gratuite et non exclusive, est valable pour toute la durée de la propriété littéraire et artistique, y compris ses éventuelles prolongations, et pour le monde entier. Je conserve tous les autres droits pour la reproduction et la communication de la thèse, ainsi que le droit de l'utiliser dans de futurs travaux. Je certifie avoir obtenu, conformément à la législation sur le droit d'auteur et aux exigences du droit à l'image, toutes les autorisations nécessaires à la reproduction dans ma thèse d'images, de textes, et/ou de toute oeuvre protégés par le droit d'auteur, et avoir obtenu les autorisations nécessaires à leur communication à des tiers. Au cas où un tiers est titulaire d'un droit de propriété intellectuelle sur tout ou partie de ma thèse, je certifie avoir obtenu son autorisation écrite pour l'exercice des droits mentionnés ci-dessus.