Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique
Parmi les paramètres influençant l'inférence d'arbres phylogénétiques, nous nous sommes penchés d'une part sur (i) l'utilisation et l'efficacité de différents marqueurs et (ii) l'influence de la radiation évolutive (la succession rapide d'événements de spéciation)...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | fr |
Published: |
Universite Libre de Bruxelles
2006
|
Subjects: | |
Online Access: | http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/ |
id |
ndltd-BICfB-oai-ulb.ac.be-ETDULB-ULBetd-07112006-210348 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
fr |
format |
Others
|
sources |
NDLTD |
topic |
homoplasie SINE tri différentiel des lignées généalogique rétroposon évolution biologie évolutive phylogénie marqueurs phylogénétique GTR |
spellingShingle |
homoplasie SINE tri différentiel des lignées généalogique rétroposon évolution biologie évolutive phylogénie marqueurs phylogénétique GTR Gatto, Laurent Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
description |
Parmi les paramètres influençant l'inférence d'arbres phylogénétiques, nous nous sommes penchés d'une part sur (i) l'utilisation et l'efficacité de différents marqueurs et (ii) l'influence de la radiation évolutive (la succession rapide d'événements de spéciation) dans la construction d'arbres phylogénétiques et, d'autre part, sur l'applicabilité du modèle de substitution nucléotidique GTR (General Time Reversible).
La première partie de ce travail étudie l'évolution des cétacés en se basant sur les séquences des génomes mitochondriaux, sur le motif d'insertion de rétroposons SINEs (short interspersed elements) nouvellement isolés et les loci nucléaires de ces derniers. Le choix des cétacés est motivé par la présence, durant leur évolution, de radiations évolutives, qui sont propices au tri différentiel de lignées généalogiques: si des séquences de gènes ou des allèles restent polymorphes entre des événements de spéciations, il est possible, et même probable, d'observer une incompatibilité entre les histoires évolutives de ces marqueurs, malgré que celles-ci soient bien correctes. Nous abordons l'étude du tri différentiel des lignées généalogiques par le biais des SINEs, dont l'insertion aléatoire et irréversible confère à ces marqueurs un risque de convergence particulièrement faible.
Notre approche multi-marqueur nous permet de reconstruire un arbre robuste à partir duquel nous analysons ces différents marqueurs à l'aide des rapports signal/bruit (la qualité du contenu informatif du marqueur) et effort/signal (les efforts à mettre en oeuvre pour obtenir du signal phylogénétique). Nous discutons également les relations conflictuelles/incorrectes obtenues à partir des différents marqueurs, notamment des motifs d'insertion de SINEs pour lesquels nous décrivons un test objectif nous permettant de différencier le tri différentiel de lignées généalogiques et la convergence.
Les modèles de substitutions nucléotidiques sont à la base de nombreuses méthodes d'inférence phylogénétiques. Parmi ces modèles, le modèle GTR est un des plus complets et des plus utilisés. Waddell and Steel [1997] ont décrit une procédure qui permet d'estimer les distances et les taux instantanés de substitution pour des séquences évoluant selon les hypothèses du modèle GTR. Il existe néanmoins des conditions qui rendent cette procédure, et donc l'utilisation du modèle GTR, inapplicables.
Nous avons simulé l'évolution de séquences d'ADN le long de 12 arbres caractérisés par un ensemble de conditions biologiquement plausibles (différentes longueurs de branches, des conditions de (non-)homogénéité de la matrice de taux instantanés de substitution et différentes longueurs de séquences). Pour chaque ensemble de conditions, nous avons évalué (i) l'applicabilité du modèle GTR et (ii) la qualité des alignements obtenus à partir des données simulées.
Nos résultats indiquent que l'inapplicabilité de la procédure de Waddell and Steel [1997] peut effectivement être considérée comme un problème pratique car elle apparaît avant les difficultés d'alignement (étape nécessaire et préalable à toute inférence phylogénétique). La probabilité de cette inapplicabilité dépend du taux de substitution et de la taille des données.
|
author2 |
Van Helden, Jacques |
author_facet |
Van Helden, Jacques Gatto, Laurent |
author |
Gatto, Laurent |
author_sort |
Gatto, Laurent |
title |
Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
title_short |
Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
title_full |
Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
title_fullStr |
Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
title_full_unstemmed |
Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
title_sort |
comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique |
publisher |
Universite Libre de Bruxelles |
publishDate |
2006 |
url |
http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/ |
work_keys_str_mv |
AT gattolaurent comparaisondelutiliteetdelefficacitededifferentsmarqueursmoleculairesadesfinsdinferencephylogenetique |
_version_ |
1716393987394240512 |
spelling |
ndltd-BICfB-oai-ulb.ac.be-ETDULB-ULBetd-07112006-2103482013-01-07T15:42:57Z Comparaison de l'utilité et de l'efficacité de différents marqueurs moléculaires à des fins d'inférence phylogénétique Gatto, Laurent homoplasie SINE tri différentiel des lignées généalogique rétroposon évolution biologie évolutive phylogénie marqueurs phylogénétique GTR Parmi les paramètres influençant l'inférence d'arbres phylogénétiques, nous nous sommes penchés d'une part sur (i) l'utilisation et l'efficacité de différents marqueurs et (ii) l'influence de la radiation évolutive (la succession rapide d'événements de spéciation) dans la construction d'arbres phylogénétiques et, d'autre part, sur l'applicabilité du modèle de substitution nucléotidique GTR (General Time Reversible). La première partie de ce travail étudie l'évolution des cétacés en se basant sur les séquences des génomes mitochondriaux, sur le motif d'insertion de rétroposons SINEs (short interspersed elements) nouvellement isolés et les loci nucléaires de ces derniers. Le choix des cétacés est motivé par la présence, durant leur évolution, de radiations évolutives, qui sont propices au tri différentiel de lignées généalogiques: si des séquences de gènes ou des allèles restent polymorphes entre des événements de spéciations, il est possible, et même probable, d'observer une incompatibilité entre les histoires évolutives de ces marqueurs, malgré que celles-ci soient bien correctes. Nous abordons l'étude du tri différentiel des lignées généalogiques par le biais des SINEs, dont l'insertion aléatoire et irréversible confère à ces marqueurs un risque de convergence particulièrement faible. Notre approche multi-marqueur nous permet de reconstruire un arbre robuste à partir duquel nous analysons ces différents marqueurs à l'aide des rapports signal/bruit (la qualité du contenu informatif du marqueur) et effort/signal (les efforts à mettre en oeuvre pour obtenir du signal phylogénétique). Nous discutons également les relations conflictuelles/incorrectes obtenues à partir des différents marqueurs, notamment des motifs d'insertion de SINEs pour lesquels nous décrivons un test objectif nous permettant de différencier le tri différentiel de lignées généalogiques et la convergence. Les modèles de substitutions nucléotidiques sont à la base de nombreuses méthodes d'inférence phylogénétiques. Parmi ces modèles, le modèle GTR est un des plus complets et des plus utilisés. Waddell and Steel [1997] ont décrit une procédure qui permet d'estimer les distances et les taux instantanés de substitution pour des séquences évoluant selon les hypothèses du modèle GTR. Il existe néanmoins des conditions qui rendent cette procédure, et donc l'utilisation du modèle GTR, inapplicables. Nous avons simulé l'évolution de séquences d'ADN le long de 12 arbres caractérisés par un ensemble de conditions biologiquement plausibles (différentes longueurs de branches, des conditions de (non-)homogénéité de la matrice de taux instantanés de substitution et différentes longueurs de séquences). Pour chaque ensemble de conditions, nous avons évalué (i) l'applicabilité du modèle GTR et (ii) la qualité des alignements obtenus à partir des données simulées. Nos résultats indiquent que l'inapplicabilité de la procédure de Waddell and Steel [1997] peut effectivement être considérée comme un problème pratique car elle apparaît avant les difficultés d'alignement (étape nécessaire et préalable à toute inférence phylogénétique). La probabilité de cette inapplicabilité dépend du taux de substitution et de la taille des données. Van Helden, Jacques Pontarotti, Pierre Milinkovitch, Michel C. Roscam-Szpirer, Josiane Urbain, Jacques Universite Libre de Bruxelles 2006-07-27 text application/pdf http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/ http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-07112006-210348/ fr unrestricted J'accepte que le texte de la thèse (ci-après l'oeuvre), sous réserve des parties couvertes par la confidentialité, soit publié dans le recueil électronique des thèses ULB. A cette fin, je donne licence à ULB : - le droit de fixer et de reproduire l'oeuvre sur support électronique : logiciel ETD/db - le droit de communiquer l'oeuvre au public Cette licence, gratuite et non exclusive, est valable pour toute la durée de la propriété littéraire et artistique, y compris ses éventuelles prolongations, et pour le monde entier. Je conserve tous les autres droits pour la reproduction et la communication de la thèse, ainsi que le droit de l'utiliser dans de futurs travaux. Je certifie avoir obtenu, conformément à la législation sur le droit d'auteur et aux exigences du droit à l'image, toutes les autorisations nécessaires à la reproduction dans ma thèse d'images, de textes, et/ou de toute oeuvre protégés par le droit d'auteur, et avoir obtenu les autorisations nécessaires à leur communication à des tiers. Au cas où un tiers est titulaire d'un droit de propriété intellectuelle sur tout ou partie de ma thèse, je certifie avoir obtenu son autorisation écrite pour l'exercice des droits mentionnés ci-dessus. |