Edit distance metrics for measuring dissimilarity between labeled gene trees

Les arbres phylogénétiques sont des instruments de biologie évolutive offrant de formidables moyens d'étude pour la génomique comparative. Ils fournissent des moyens de représenter des mécanismes permettant de modéliser les relations de parenté entre les espèces ou les membres de familles de g...

Full description

Bibliographic Details
Main Author: Briand, Samuel
Other Authors: El-Mabrouk, Nadia
Language:English
Published: 2021
Subjects:
Online Access:http://hdl.handle.net/1866/24309
id ndltd-umontreal.ca-oai-papyrus.bib.umontreal.ca-1866-24309
record_format oai_dc
spelling ndltd-umontreal.ca-oai-papyrus.bib.umontreal.ca-1866-243092021-01-24T05:18:31Z Edit distance metrics for measuring dissimilarity between labeled gene trees Briand, Samuel El-Mabrouk, Nadia Distance d’édition Évolution Arbre génétique Arbre étiqueté Robinson-Foulds Métrique d’arbre Histoire de l’évolution Evolution Edit distance Gene tree Labeled tree Tree metric Evolutionary history Biology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715) Les arbres phylogénétiques sont des instruments de biologie évolutive offrant de formidables moyens d'étude pour la génomique comparative. Ils fournissent des moyens de représenter des mécanismes permettant de modéliser les relations de parenté entre les espèces ou les membres de familles de gènes en fonction de la diversité taxonomique, ainsi que des observations et des renseignements sur l'histoire évolutive, la structure et la variation des processus biologiques. Cependant, les méthodes traditionnelles d'inférence phylogénétique ont la réputation d'être sensibles aux erreurs. Il est donc indispensable de comparer les arbres phylogénétiques et de les analyser pour obtenir la meilleure interprétation des données biologiques qu'ils peuvent fournir. Nous commençons par aborder les travaux connexes existants pour déduire, comparer et analyser les arbres phylogénétiques, en évaluant leurs bonnes caractéristiques ainsi que leurs défauts, et discuter des pistes d'améliorations futures. La deuxième partie de cette thèse se concentre sur le développement de mesures efficaces et précises pour analyser et comparer des paires d'arbres génétiques avec des nœuds internes étiquetés. Nous montrons que notre extension de la métrique bien connue de Robinson-Foulds donne lieu à une bonne métrique pour la comparaison d'arbres génétiques étiquetés sous divers modèles évolutifs, et qui peuvent impliquer divers événements évolutifs. Phylogenetic trees are instruments of evolutionary biology offering great insight for comparative genomics. They provide mechanisms to model the kinship relations between species or members of gene families as a function of taxonomic diversity. They also provide evidence and insights into the evolutionary history, structure, and variation of biological processes. However, traditional phylogenetic inference methods have the reputation to be prone to errors. Therefore, comparing and analysing phylogenetic trees is indispensable for obtaining the best interpretation of the biological information they can provide. We start by assessing existing related work to infer, compare, and analyse phylogenetic trees, evaluating their advantageous traits and flaws, and discussing avenues for future improvements. The second part of this thesis focuses on the development of efficient and accurate metrics to analyse and compare pairs of gene trees with labeled internal nodes. We show that our attempt in extending the popular Robinson-Foulds metric is useful for the preliminary analysis and comparison of labeled gene trees under various evolutionary models that may involve various evolutionary events. 2021-01-22T13:27:59Z NO_RESTRICTION 2021-01-22T13:27:59Z 2020-12-16 2020-08 thesis thèse http://hdl.handle.net/1866/24309 eng
collection NDLTD
language English
sources NDLTD
topic Distance d’édition
Évolution
Arbre génétique
Arbre étiqueté
Robinson-Foulds
Métrique d’arbre
Histoire de l’évolution
Evolution
Edit distance
Gene tree
Labeled tree
Tree metric
Evolutionary history
Biology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715)
spellingShingle Distance d’édition
Évolution
Arbre génétique
Arbre étiqueté
Robinson-Foulds
Métrique d’arbre
Histoire de l’évolution
Evolution
Edit distance
Gene tree
Labeled tree
Tree metric
Evolutionary history
Biology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715)
Briand, Samuel
Edit distance metrics for measuring dissimilarity between labeled gene trees
description Les arbres phylogénétiques sont des instruments de biologie évolutive offrant de formidables moyens d'étude pour la génomique comparative. Ils fournissent des moyens de représenter des mécanismes permettant de modéliser les relations de parenté entre les espèces ou les membres de familles de gènes en fonction de la diversité taxonomique, ainsi que des observations et des renseignements sur l'histoire évolutive, la structure et la variation des processus biologiques. Cependant, les méthodes traditionnelles d'inférence phylogénétique ont la réputation d'être sensibles aux erreurs. Il est donc indispensable de comparer les arbres phylogénétiques et de les analyser pour obtenir la meilleure interprétation des données biologiques qu'ils peuvent fournir. Nous commençons par aborder les travaux connexes existants pour déduire, comparer et analyser les arbres phylogénétiques, en évaluant leurs bonnes caractéristiques ainsi que leurs défauts, et discuter des pistes d'améliorations futures. La deuxième partie de cette thèse se concentre sur le développement de mesures efficaces et précises pour analyser et comparer des paires d'arbres génétiques avec des nœuds internes étiquetés. Nous montrons que notre extension de la métrique bien connue de Robinson-Foulds donne lieu à une bonne métrique pour la comparaison d'arbres génétiques étiquetés sous divers modèles évolutifs, et qui peuvent impliquer divers événements évolutifs. === Phylogenetic trees are instruments of evolutionary biology offering great insight for comparative genomics. They provide mechanisms to model the kinship relations between species or members of gene families as a function of taxonomic diversity. They also provide evidence and insights into the evolutionary history, structure, and variation of biological processes. However, traditional phylogenetic inference methods have the reputation to be prone to errors. Therefore, comparing and analysing phylogenetic trees is indispensable for obtaining the best interpretation of the biological information they can provide. We start by assessing existing related work to infer, compare, and analyse phylogenetic trees, evaluating their advantageous traits and flaws, and discussing avenues for future improvements. The second part of this thesis focuses on the development of efficient and accurate metrics to analyse and compare pairs of gene trees with labeled internal nodes. We show that our attempt in extending the popular Robinson-Foulds metric is useful for the preliminary analysis and comparison of labeled gene trees under various evolutionary models that may involve various evolutionary events.
author2 El-Mabrouk, Nadia
author_facet El-Mabrouk, Nadia
Briand, Samuel
author Briand, Samuel
author_sort Briand, Samuel
title Edit distance metrics for measuring dissimilarity between labeled gene trees
title_short Edit distance metrics for measuring dissimilarity between labeled gene trees
title_full Edit distance metrics for measuring dissimilarity between labeled gene trees
title_fullStr Edit distance metrics for measuring dissimilarity between labeled gene trees
title_full_unstemmed Edit distance metrics for measuring dissimilarity between labeled gene trees
title_sort edit distance metrics for measuring dissimilarity between labeled gene trees
publishDate 2021
url http://hdl.handle.net/1866/24309
work_keys_str_mv AT briandsamuel editdistancemetricsformeasuringdissimilaritybetweenlabeledgenetrees
_version_ 1719374352870277120