Usando uma abordagem filogenômica para o estudo dos protozoários
Submitted by Tatiana Silva (tsilva@icict.fiocruz.br) on 2012-12-27T17:46:12Z No. of bitstreams: 1 kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5) === Made available in DSpace on 2012-12-27T17:46:12Z (GMT). No. of bitstreams: 1 kary_a_c_s_oca...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
2012
|
Subjects: | |
Online Access: | https://www.arca.fiocruz.br/handle/icict/6067 |
id |
ndltd-IBICT-oai-www.arca.fiocruz.br-icict-6067 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Elementos Genéticos Móveis Protozoários Filogenômica Bioinformática |
spellingShingle |
Elementos Genéticos Móveis Protozoários Filogenômica Bioinformática Ocaña, Kary Ann del Carmen Soriano Usando uma abordagem filogenômica para o estudo dos protozoários |
description |
Submitted by Tatiana Silva (tsilva@icict.fiocruz.br) on 2012-12-27T17:46:12Z
No. of bitstreams: 1
kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5) === Made available in DSpace on 2012-12-27T17:46:12Z (GMT). No. of bitstreams: 1
kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5)
Previous issue date: 2010 === Fundação Oswaldo Cruz.Instituto Oswaldo Cruz. Rio de janeiro, RJ, Brasil === A reconstrução da história evolutiva, assim como o estabelecimento de hipóteses que
demonstrem as relações filogenéticas dos protozoários bem como dos genes codificados pelos
Elementos Genéticos Móveis (EGM) requerem o uso de várias abordagens e ferramentas, as
quais não se encontram disponíveis de maneira integrada nem de maneira amigável. Diferentes
abordagens filogenéticas, filogenômicas e evolutivas são necessárias para a inferência da
filogenia de espécies e o estudo de genes pouco conservados como a transcriptase reversa, o gene
mais representativo da classe I dos EGM, os retrotransposons. Os principais algoritmos
filogenéticos e os programas que os executam têm sido unificados num único sistema: ARPA,
escrito na linguagem de programação PYTHON. O sistema ARPA e a interface webestão
hospedados na FIOCRUZ e estão disponíveis no endereço http://arpa.biowebdb.org. Eles estão
sendo integrados ao sistema de banco de dados ProtozoaDB (http://protozoadb.biowebdb.org) e
ao sistema de anotação semi-automática Stingray (http://stingray.biowebdb.org/). Uma
abordagem baseada nos fundamentos da filogenômica eevolução foi utilizada para desenvolver
cinco objetivos: (i) analisar e inferir a filogeniados genes relacionados à resistência de drogas em
protozoários, (ii) reconstruir a árvore de espéciesde protozoários, (iii) realizar estudos de
filogenômica dos EGM em protozoários, (iv) inferir a filogenia da telomerase e dos elementos de
retrotransposição em Tri-tryps e (v) adaptar e ampliar o esquema Phylo ao banco de dados GUS
para o armazenamento da informação filogenética.
Os principais resultados obtidos para cada objetivosão: (i) As inferências filogenéticas
dos genes AQP, hsp70, GP63, TRYR e MRPA relacionados à resistência a drogas em
protozoários demonstrou a viabilidade das execuçõesdo sistema ARPA; (ii) a árvore de espécies
de protozoários usando a abordagem da supermatriz provou ser confiável, e o teste PTP e a
estatística G1 demonstraram que os dados moleculares deste estudo possuem sinal filogenético;
(iii) o RAXML foi o programa mais consistente ao lidar com os diferentes níveis de
polimorfismos destes genes, a detecção in silicoda seleção positiva destes genes foi detectada nas
análises pareadas dos modelos M1-M2 e M7-M8, porém o par M0-M3 indicou uma alta
variabilidade da razão ωentre os sítios; (iv) foi observada a monofilia para a telomerase a que
está mais relacionada à transcriptase reversa dos retrotransposons não-LTR; (iv) um novo
esquema Phylo foi concebido e incorporado no GUS 3.5 estendendo-o a fim de armazenar os
dados obtidos de inferências filogenéticas.
As principais conclusões são: (i) O sistema ARPA é uma alternativa viável, eficiente,
fácil e de tempo reduzido para as análises filogenômicas. O RAXML foi considerado o programa
mais consistente e foi observado que as árvores construídas usando as sequências inteiras e/ou as
trimadas com o TRIMAL apresentaram os melhores resultados. A abordagem da supermatriz
apresentou melhores resultados do que a superárvore; (ii) as relações entre os grupos de
protozoários estão de acordo com estudos anterioresda literatura, os quais determinaram também
uma monofilia para os protozoários. A inclusão de mais dados/genes é necessária para obter uma
árvore robusta; (iii) foram reconstruídas as árvores dos genes dos EGM e inferida a filogenia para
cada um deles. O modelo M3 indicou uma alta variabilidade da razão ωentre os sítios e os
modelos M7 e M8 indicaram a presença de seleção positiva para todos os genes dos EGM; (iv) a
telomerase formou um grupo monofilético mais relacionado à transcriptase reversa dos
retrotransposons não-LTR; (v) o esquema Phylo armazena os dados obtidos de experiências
filogenéticas, mantendo as relações de herança filogenética entre cada um dos táxons, o que
permite realizar consultas usando as informações dos ramos, dos nós e táxons da árvore. === The reconstruction of the evolutionary history, as well as the establishment of the
hypotheses that demonstrate the phylogenetic relationships of the genes encoded by Mobile
Genetic Elements (MGEs) require the use of various tools and approaches, which are not
available in a friendly or integrated interface. Different phylogenetics, phylogenomics and
evolutionary approaches are necessary for the inference of the species phylogeny. These same
approaches are required on the study of less conserved genes as the reverse transcriptase that is
the most representative gene of the class I of the MGEs, the retrotransposons. The main
phylogenetic algorithms and programs developed by our group have been unified into a single
system - the ARPA - written in the programming language PYTHON. The ARPA system and the
web interface are hosted at FIOCRUZ and are available at http://arpa.biowebdb.org. They are
currently being integrated to the database system ProtozoaDB (http://protozoadb.biowebdb.org)
and to the semi-automatic annotation system Stingray (http://stinngray.biowebdb.org/). An
approach based on the fundamentals of evolution andphylogenomics has been applied to achieve
five different objectives: (i) to analyze and to infer the phylogeny to the genes related to drug
resistance in protozoan genomes, (ii) to reconstruct a protozoan species tree, (iii) to conduct
phylogenomic studies of MGEs in Protozoa, (iv) to infer phylogeny from the telomerase and the
retrotransposable elements in Tri-Tryps and (v) to adapt and to extend the schema Phylo to the
GUS database, for storing phylogenetic informations.
The results obtained for topics were: (i) The construction of the phylogenetic trees of the
genes, AQP, hsp70, GP63, TRYR and MRPA which are related to drug resistance in protozoan
demonstrated the viability of the executions of theARPA system. (ii) The protozoan species tree
using the supermatrix approach proved to be reliable. The PTP Test and the Statistical G1
demonstrated that the molecular data of this study have phylogenetic signal. (iii) The PAUP-AV
was shown to be the most consistent program and thePHYML was the least to deal with different
levels of polymorphisms of these genes. The in silicodetection of the positive selection in MGEs
genes in Protozoa was detected in the paired analysis of the models M1-M2 and M7-M8, but the
pair M0-M3 indicated a high variability of the ratio ωbetween the sites. (iv) It was found that a
monophyly is present for the telomerase, which was the most closely related to the transcriptase
of the non-LTR retrotransposons. (v) A new Phylo schema was designed and incorporated into
the GUS 3.5 extending its service to store the dataobtained from phylogenetic experiments.
As conclusions: (i) The ARPA system is a viable, efficient, easy and reduced time
alternative for phylogenomic analysis. The RAXML was considered the most consistent program
and was observed that the trees constructed using the entire and/or the trimmed sequences with
TRIMAL showed the best results. The supermatrix approach showed better results than the
supertree. (ii) The relationships between protozoangroups are in agreement with previous
studies, which also determined a monophyly for protozoan. The inclusion of more data/genes is
required to obtain a consistent tree. (iii) In the trees of the EGM, the PAUP-AV was the most
consistent and the PHYML the least to deal with different levels of polymorphisms of these
genes. The model M3 showed a high variability of ωratio among sites and the models M7 and
M8 indicated the presence of positive selection forall genes of EGM. (iv) The telomerase formed
a monophyletic group more related to the reverse transcriptase of the non-LTR retrotransposons.
(v) The scheme Phylo stores the data obtained from phylogenetic experiences, keeping the
inheritance of phylogenetic relationships between each of the taxa, which can perform queries using information from the branches, nodes and taxaof the tree. |
author2 |
Miranda, Antonio Basilio de |
author_facet |
Miranda, Antonio Basilio de Ocaña, Kary Ann del Carmen Soriano |
author |
Ocaña, Kary Ann del Carmen Soriano |
author_sort |
Ocaña, Kary Ann del Carmen Soriano |
title |
Usando uma abordagem filogenômica para o estudo dos protozoários |
title_short |
Usando uma abordagem filogenômica para o estudo dos protozoários |
title_full |
Usando uma abordagem filogenômica para o estudo dos protozoários |
title_fullStr |
Usando uma abordagem filogenômica para o estudo dos protozoários |
title_full_unstemmed |
Usando uma abordagem filogenômica para o estudo dos protozoários |
title_sort |
usando uma abordagem filogenômica para o estudo dos protozoários |
publishDate |
2012 |
url |
https://www.arca.fiocruz.br/handle/icict/6067 |
work_keys_str_mv |
AT ocanakaryanndelcarmensoriano usandoumaabordagemfilogenomicaparaoestudodosprotozoarios |
_version_ |
1718830481605132288 |
spelling |
ndltd-IBICT-oai-www.arca.fiocruz.br-icict-60672019-01-21T16:51:21Z Usando uma abordagem filogenômica para o estudo dos protozoários Ocaña, Kary Ann del Carmen Soriano Miranda, Antonio Basilio de Schrago, Carlos Guerra Probst, Christian Macagnan Campos, Maria Luiza Machado Brandão, Adeilton Alves Dávila, Alberto Martín Rivera Elementos Genéticos Móveis Protozoários Filogenômica Bioinformática Submitted by Tatiana Silva (tsilva@icict.fiocruz.br) on 2012-12-27T17:46:12Z No. of bitstreams: 1 kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5) Made available in DSpace on 2012-12-27T17:46:12Z (GMT). No. of bitstreams: 1 kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5) Previous issue date: 2010 Fundação Oswaldo Cruz.Instituto Oswaldo Cruz. Rio de janeiro, RJ, Brasil A reconstrução da história evolutiva, assim como o estabelecimento de hipóteses que demonstrem as relações filogenéticas dos protozoários bem como dos genes codificados pelos Elementos Genéticos Móveis (EGM) requerem o uso de várias abordagens e ferramentas, as quais não se encontram disponíveis de maneira integrada nem de maneira amigável. Diferentes abordagens filogenéticas, filogenômicas e evolutivas são necessárias para a inferência da filogenia de espécies e o estudo de genes pouco conservados como a transcriptase reversa, o gene mais representativo da classe I dos EGM, os retrotransposons. Os principais algoritmos filogenéticos e os programas que os executam têm sido unificados num único sistema: ARPA, escrito na linguagem de programação PYTHON. O sistema ARPA e a interface webestão hospedados na FIOCRUZ e estão disponíveis no endereço http://arpa.biowebdb.org. Eles estão sendo integrados ao sistema de banco de dados ProtozoaDB (http://protozoadb.biowebdb.org) e ao sistema de anotação semi-automática Stingray (http://stingray.biowebdb.org/). Uma abordagem baseada nos fundamentos da filogenômica eevolução foi utilizada para desenvolver cinco objetivos: (i) analisar e inferir a filogeniados genes relacionados à resistência de drogas em protozoários, (ii) reconstruir a árvore de espéciesde protozoários, (iii) realizar estudos de filogenômica dos EGM em protozoários, (iv) inferir a filogenia da telomerase e dos elementos de retrotransposição em Tri-tryps e (v) adaptar e ampliar o esquema Phylo ao banco de dados GUS para o armazenamento da informação filogenética. Os principais resultados obtidos para cada objetivosão: (i) As inferências filogenéticas dos genes AQP, hsp70, GP63, TRYR e MRPA relacionados à resistência a drogas em protozoários demonstrou a viabilidade das execuçõesdo sistema ARPA; (ii) a árvore de espécies de protozoários usando a abordagem da supermatriz provou ser confiável, e o teste PTP e a estatística G1 demonstraram que os dados moleculares deste estudo possuem sinal filogenético; (iii) o RAXML foi o programa mais consistente ao lidar com os diferentes níveis de polimorfismos destes genes, a detecção in silicoda seleção positiva destes genes foi detectada nas análises pareadas dos modelos M1-M2 e M7-M8, porém o par M0-M3 indicou uma alta variabilidade da razão ωentre os sítios; (iv) foi observada a monofilia para a telomerase a que está mais relacionada à transcriptase reversa dos retrotransposons não-LTR; (iv) um novo esquema Phylo foi concebido e incorporado no GUS 3.5 estendendo-o a fim de armazenar os dados obtidos de inferências filogenéticas. As principais conclusões são: (i) O sistema ARPA é uma alternativa viável, eficiente, fácil e de tempo reduzido para as análises filogenômicas. O RAXML foi considerado o programa mais consistente e foi observado que as árvores construídas usando as sequências inteiras e/ou as trimadas com o TRIMAL apresentaram os melhores resultados. A abordagem da supermatriz apresentou melhores resultados do que a superárvore; (ii) as relações entre os grupos de protozoários estão de acordo com estudos anterioresda literatura, os quais determinaram também uma monofilia para os protozoários. A inclusão de mais dados/genes é necessária para obter uma árvore robusta; (iii) foram reconstruídas as árvores dos genes dos EGM e inferida a filogenia para cada um deles. O modelo M3 indicou uma alta variabilidade da razão ωentre os sítios e os modelos M7 e M8 indicaram a presença de seleção positiva para todos os genes dos EGM; (iv) a telomerase formou um grupo monofilético mais relacionado à transcriptase reversa dos retrotransposons não-LTR; (v) o esquema Phylo armazena os dados obtidos de experiências filogenéticas, mantendo as relações de herança filogenética entre cada um dos táxons, o que permite realizar consultas usando as informações dos ramos, dos nós e táxons da árvore. The reconstruction of the evolutionary history, as well as the establishment of the hypotheses that demonstrate the phylogenetic relationships of the genes encoded by Mobile Genetic Elements (MGEs) require the use of various tools and approaches, which are not available in a friendly or integrated interface. Different phylogenetics, phylogenomics and evolutionary approaches are necessary for the inference of the species phylogeny. These same approaches are required on the study of less conserved genes as the reverse transcriptase that is the most representative gene of the class I of the MGEs, the retrotransposons. The main phylogenetic algorithms and programs developed by our group have been unified into a single system - the ARPA - written in the programming language PYTHON. The ARPA system and the web interface are hosted at FIOCRUZ and are available at http://arpa.biowebdb.org. They are currently being integrated to the database system ProtozoaDB (http://protozoadb.biowebdb.org) and to the semi-automatic annotation system Stingray (http://stinngray.biowebdb.org/). An approach based on the fundamentals of evolution andphylogenomics has been applied to achieve five different objectives: (i) to analyze and to infer the phylogeny to the genes related to drug resistance in protozoan genomes, (ii) to reconstruct a protozoan species tree, (iii) to conduct phylogenomic studies of MGEs in Protozoa, (iv) to infer phylogeny from the telomerase and the retrotransposable elements in Tri-Tryps and (v) to adapt and to extend the schema Phylo to the GUS database, for storing phylogenetic informations. The results obtained for topics were: (i) The construction of the phylogenetic trees of the genes, AQP, hsp70, GP63, TRYR and MRPA which are related to drug resistance in protozoan demonstrated the viability of the executions of theARPA system. (ii) The protozoan species tree using the supermatrix approach proved to be reliable. The PTP Test and the Statistical G1 demonstrated that the molecular data of this study have phylogenetic signal. (iii) The PAUP-AV was shown to be the most consistent program and thePHYML was the least to deal with different levels of polymorphisms of these genes. The in silicodetection of the positive selection in MGEs genes in Protozoa was detected in the paired analysis of the models M1-M2 and M7-M8, but the pair M0-M3 indicated a high variability of the ratio ωbetween the sites. (iv) It was found that a monophyly is present for the telomerase, which was the most closely related to the transcriptase of the non-LTR retrotransposons. (v) A new Phylo schema was designed and incorporated into the GUS 3.5 extending its service to store the dataobtained from phylogenetic experiments. As conclusions: (i) The ARPA system is a viable, efficient, easy and reduced time alternative for phylogenomic analysis. The RAXML was considered the most consistent program and was observed that the trees constructed using the entire and/or the trimmed sequences with TRIMAL showed the best results. The supermatrix approach showed better results than the supertree. (ii) The relationships between protozoangroups are in agreement with previous studies, which also determined a monophyly for protozoan. The inclusion of more data/genes is required to obtain a consistent tree. (iii) In the trees of the EGM, the PAUP-AV was the most consistent and the PHYML the least to deal with different levels of polymorphisms of these genes. The model M3 showed a high variability of ωratio among sites and the models M7 and M8 indicated the presence of positive selection forall genes of EGM. (iv) The telomerase formed a monophyletic group more related to the reverse transcriptase of the non-LTR retrotransposons. (v) The scheme Phylo stores the data obtained from phylogenetic experiences, keeping the inheritance of phylogenetic relationships between each of the taxa, which can perform queries using information from the branches, nodes and taxaof the tree. 2012-12-27T17:46:12Z 2012-12-27T17:46:12Z 2010 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis OCAÑA,K. A. del C. S. Usando uma abordagem filogenômica para o estudo dos protozoários. 2010. 236 f. Tese(Doutorado em Ensino em Biologia Celular e Molecular) - Fundação Oswaldo Cruz, Rio de Janeiro, 2010 https://www.arca.fiocruz.br/handle/icict/6067 por Kary Ann del Carmen Soriano Ocaña info:eu-repo/semantics/openAccess reponame:Repositório Institucional da FIOCRUZ instname:Fundação Oswaldo Cruz instacron:FIOCRUZ |