Genômica comparativa de protozoários

Made available in DSpace on 2016-04-12T12:41:56Z (GMT). No. of bitstreams: 2 diogo_tschoeke_ioc_dout_2013.pdf: 6504204 bytes, checksum: 8ee03e5b054b7754e81ce9d1e278efee (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2013 === Fundação Oswaldo Cr...

Full description

Bibliographic Details
Main Author: Tschoeke, Diogo Antônio
Other Authors: Levy, Claudia M.D’Ávila
Language:Portuguese
Published: 2016
Subjects:
Online Access:https://www.arca.fiocruz.br/handle/icict/13702
id ndltd-IBICT-oai-www.arca.fiocruz.br-icict-13702
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Biologia Computacional
Genômica
Infecções por Protozoários
Classificação
spellingShingle Biologia Computacional
Genômica
Infecções por Protozoários
Classificação
Tschoeke, Diogo Antônio
Genômica comparativa de protozoários
description Made available in DSpace on 2016-04-12T12:41:56Z (GMT). No. of bitstreams: 2 diogo_tschoeke_ioc_dout_2013.pdf: 6504204 bytes, checksum: 8ee03e5b054b7754e81ce9d1e278efee (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2013 === Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil === Os protozoários são definidos como organismos eucariotos unicelulares, e apresentam grande diversidade e variedade. Cerca de 200 mil espécies são descritas e quase 10.000 são parasitas. As espécies patogênicas causam doenças como a malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase. Portanto, estudos comparativos entre os protozoários são importantes porque estes podem mostrar semelhanças e diferenças entre essas espécies. A identificação de ortólogos é importante para a categorização funcional de genomas, porque ortólogos tipicamente ocupam o mesmo nicho funcional nos diferentes organismos, enquanto a identificação de parálogos é importante porque eles são submetidos a uma diversificação funcional via duplicação, através dos processos de neofuncionalização e subfuncionalização. A fim de realizar uma análise comparativa de 22 protozoários, 204.624 proteínas não redundantes de Plasmodium, Entamoeba, Trypanosoma, Leishmania, Giardia, Theileria, Toxoplasma, Trichomonas e Cryptosporidium, foram submetidos ao programa OrthoMCL, resultando em 26.101 grupos homólogos. Entre eles, 21.119 grupos são ortólogos, incluindo 7.679 co-ortólogos (grupos que contêm parálogos recentes), e 4982 são parálogos internos. Entre os ortólogos, 348 são compartilhados por todas as 22 espécies e representam o núcleo proteômico de Protozoa Com este núcleo realizamos uma análise filogenômica, usando os 348 ortólogos concatenados, resultando em uma supermatriz de 328.228 posições, que geraram uma árvore de espécies para os 22 protozoários. Quando inferimos os diferentes Núcleos Proteômicos, Kinetoplastida tem 5.000 grupos ortólogos e 67,92 % (3396/5000) são Kinetoplastida específicos, além disso, 46,29% (1592/3396) destes ortólogos são anotados como "hipotéticos". O núcleo proteômico de Apicomplexa tem 986 grupos ortólogos e 27,82% (224/986) são específicos, enquanto que 40,63% (92 /224) destes são classificados como hipotéticos. O núcleo proteômico de Entamoeba tem 5.915 grupos ortólogos e 75,08% (4441/5915) destes grupos são específicos, sendo que 65,41% (2905/4441) são anotados como hipotéticos. Analisando os parálogos, Trichomonas vaginalis foi a espécie que apresentou o maior número de grupos parálogos internos, 2933, e também mostrou 948 co-ortólogos totalizando 3.881 parálogos. Um aprofundamento da análise na ordem Kinetoplastida mostrou que Trypanosoma cruzi apresenta o número mais elevado de duplicações, totalizando 5.777 parálogos, sendo 4963 co-ortólogos e 814 parálogos internos Os resultados da montagem e análise de L. amazonensis resultaram 29.670.588 bases e 8802 CDS identificadas. A análise comparativa do gênero Leishmania mostrou que as seis espécies estudadas compartilham 7016 ortólogos, enquanto L. amazonensis e L. mexicana têm o maior número de ortólogos-específicos e L. braziliensis o maior número de paralogos internos. A análise filogenômica mostrou a posição taxonômica esperada de L. amazonensis e juntamente com L. mexicana formando o "complexo Mexicana", além da separação esperada do subgênero Leishmania. Encontramos potenciais proteínas análogas entre L. amazonensis e Homo sapiens e dentro do genoma de L. amazonensis, denominados análogos intragenômicos. Finalmente, a mineração por genes de RNAi mostrou que L. amazonensis , provavelmente não apresenta esta via funcional === Protozoa are defined as single celled eukaryotic organisms showing an extremely diversity and variety. Approximately 200,000 species are described and nearly 10,000 are parasitic. The pathogenic species cause diseases such as malaria, sleeping sickness, Ch agas disease, leishmaniasis, amoebiasis and giardiasis. Therefore, comparative studies among Protozoa are important because they may identify similarities and differences in these species. Orthologs identification is central to functional characterization of genomes because orthologs typically occupy the same functional niche in different organisms, while paralogs identification is important because they undergo a functional diversification by duplication, via the processes of neofunctionalization and subfu nctionalization. In order to perform comparative protozoa analysis, 204,624 non - redundant proteins from Plasmodium , Entamoeba , Trypanosoma , Leishmania , Giardia , Theileria , Toxoplasma , Trichomonas and Cryptosporidium , totalizing 22 species, were submitted t o OrthoMCL resulting in 26,101 homologs groups. Among them, 21,119 groups are orthologs including 7,679 co - orthologs (groups that contain recent paralogs) and 4,982 are inparalogs. Among the orthologs, 348 are shared by all 22 species, representing the Pro tozoa core proteome, with this core we perform ed a phylogenomic analysis with the 348 concatenated orthologs, resulting in a global supermatrix of 328,228 positions that generate a species tree for the 22 protozoa. When we inferred Core Proteome, the Kinet oplastida core has 5,000 orthologous groups and 67.92% (3,396/5000) are Kinetoplastida Specific, besides 46.29% (1,592/3,396) of these orthologs are annotated as “hypothetical”. Apicomplexa Core Proteome has 986 orthologous groups and 27.82% (224/986) are Apicomplexa Specific whereas 40.63% (92/224) were classified as hypothetical proteins. Entamoeba Core Proteome has 5,915 orthologous groups and 75.08% (4,441/5,915) of these groups are Entamoeba Specific and 65.41% (2,905/4441) were annotated as hypothetic al. Analyzing the paralogs, Trichomonas vaginalis was the specie s that presented the highest number of inparalogs groups, 2,933 and also showed 948 co - orthologs totalizing 3881 paralogs. A deep look into the Kinetoplastida order showed that Trypanosoma cruzi has the highest duplication number, totalizing 5777 paralogs, 4963 co - orthologs and 814 inparalogs groups . The L. amazonensis analysis resulted in 29,670,588 bases assembled, and 8802 CDS identified. Comparative analysis into the Leishman ia genus showed that these 6 species share 7016 ortologs, whilst L. amazonensis and L. mexicana has the biggest number of specific orthologs and L. braziliensis biggest number of inparalogs. Phylogenomic analysis showed the expected L. amazonensis taxonomi c position together with L. mexicana forming the “Mexicana complex” and the New and Old Leishmania (L . ). spp. separation. Potential analagous proteins were found between L. amazonensis and H omo sapiens , and also into the L. amazonensis proteome. Finally, R NAi analysis showed that L. amazonensis , probably, do not have functional RNAi pathway
author2 Levy, Claudia M.D’Ávila
author_facet Levy, Claudia M.D’Ávila
Tschoeke, Diogo Antônio
author Tschoeke, Diogo Antônio
author_sort Tschoeke, Diogo Antônio
title Genômica comparativa de protozoários
title_short Genômica comparativa de protozoários
title_full Genômica comparativa de protozoários
title_fullStr Genômica comparativa de protozoários
title_full_unstemmed Genômica comparativa de protozoários
title_sort genômica comparativa de protozoários
publishDate 2016
url https://www.arca.fiocruz.br/handle/icict/13702
work_keys_str_mv AT tschoekediogoantonio genomicacomparativadeprotozoarios
_version_ 1718831128939331584
spelling ndltd-IBICT-oai-www.arca.fiocruz.br-icict-137022019-01-21T16:54:53Z Genômica comparativa de protozoários Tschoeke, Diogo Antônio Levy, Claudia M.D’Ávila Campos, Maria Luiza Machado Probst, Christian M. Cavalcanti, Maria Cláudia Koerich, Leonardo B. Rivera Davila, Alberto Martin Biologia Computacional Genômica Infecções por Protozoários Classificação Made available in DSpace on 2016-04-12T12:41:56Z (GMT). No. of bitstreams: 2 diogo_tschoeke_ioc_dout_2013.pdf: 6504204 bytes, checksum: 8ee03e5b054b7754e81ce9d1e278efee (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2013 Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil Os protozoários são definidos como organismos eucariotos unicelulares, e apresentam grande diversidade e variedade. Cerca de 200 mil espécies são descritas e quase 10.000 são parasitas. As espécies patogênicas causam doenças como a malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase. Portanto, estudos comparativos entre os protozoários são importantes porque estes podem mostrar semelhanças e diferenças entre essas espécies. A identificação de ortólogos é importante para a categorização funcional de genomas, porque ortólogos tipicamente ocupam o mesmo nicho funcional nos diferentes organismos, enquanto a identificação de parálogos é importante porque eles são submetidos a uma diversificação funcional via duplicação, através dos processos de neofuncionalização e subfuncionalização. A fim de realizar uma análise comparativa de 22 protozoários, 204.624 proteínas não redundantes de Plasmodium, Entamoeba, Trypanosoma, Leishmania, Giardia, Theileria, Toxoplasma, Trichomonas e Cryptosporidium, foram submetidos ao programa OrthoMCL, resultando em 26.101 grupos homólogos. Entre eles, 21.119 grupos são ortólogos, incluindo 7.679 co-ortólogos (grupos que contêm parálogos recentes), e 4982 são parálogos internos. Entre os ortólogos, 348 são compartilhados por todas as 22 espécies e representam o núcleo proteômico de Protozoa Com este núcleo realizamos uma análise filogenômica, usando os 348 ortólogos concatenados, resultando em uma supermatriz de 328.228 posições, que geraram uma árvore de espécies para os 22 protozoários. Quando inferimos os diferentes Núcleos Proteômicos, Kinetoplastida tem 5.000 grupos ortólogos e 67,92 % (3396/5000) são Kinetoplastida específicos, além disso, 46,29% (1592/3396) destes ortólogos são anotados como "hipotéticos". O núcleo proteômico de Apicomplexa tem 986 grupos ortólogos e 27,82% (224/986) são específicos, enquanto que 40,63% (92 /224) destes são classificados como hipotéticos. O núcleo proteômico de Entamoeba tem 5.915 grupos ortólogos e 75,08% (4441/5915) destes grupos são específicos, sendo que 65,41% (2905/4441) são anotados como hipotéticos. Analisando os parálogos, Trichomonas vaginalis foi a espécie que apresentou o maior número de grupos parálogos internos, 2933, e também mostrou 948 co-ortólogos totalizando 3.881 parálogos. Um aprofundamento da análise na ordem Kinetoplastida mostrou que Trypanosoma cruzi apresenta o número mais elevado de duplicações, totalizando 5.777 parálogos, sendo 4963 co-ortólogos e 814 parálogos internos Os resultados da montagem e análise de L. amazonensis resultaram 29.670.588 bases e 8802 CDS identificadas. A análise comparativa do gênero Leishmania mostrou que as seis espécies estudadas compartilham 7016 ortólogos, enquanto L. amazonensis e L. mexicana têm o maior número de ortólogos-específicos e L. braziliensis o maior número de paralogos internos. A análise filogenômica mostrou a posição taxonômica esperada de L. amazonensis e juntamente com L. mexicana formando o "complexo Mexicana", além da separação esperada do subgênero Leishmania. Encontramos potenciais proteínas análogas entre L. amazonensis e Homo sapiens e dentro do genoma de L. amazonensis, denominados análogos intragenômicos. Finalmente, a mineração por genes de RNAi mostrou que L. amazonensis , provavelmente não apresenta esta via funcional Protozoa are defined as single celled eukaryotic organisms showing an extremely diversity and variety. Approximately 200,000 species are described and nearly 10,000 are parasitic. The pathogenic species cause diseases such as malaria, sleeping sickness, Ch agas disease, leishmaniasis, amoebiasis and giardiasis. Therefore, comparative studies among Protozoa are important because they may identify similarities and differences in these species. Orthologs identification is central to functional characterization of genomes because orthologs typically occupy the same functional niche in different organisms, while paralogs identification is important because they undergo a functional diversification by duplication, via the processes of neofunctionalization and subfu nctionalization. In order to perform comparative protozoa analysis, 204,624 non - redundant proteins from Plasmodium , Entamoeba , Trypanosoma , Leishmania , Giardia , Theileria , Toxoplasma , Trichomonas and Cryptosporidium , totalizing 22 species, were submitted t o OrthoMCL resulting in 26,101 homologs groups. Among them, 21,119 groups are orthologs including 7,679 co - orthologs (groups that contain recent paralogs) and 4,982 are inparalogs. Among the orthologs, 348 are shared by all 22 species, representing the Pro tozoa core proteome, with this core we perform ed a phylogenomic analysis with the 348 concatenated orthologs, resulting in a global supermatrix of 328,228 positions that generate a species tree for the 22 protozoa. When we inferred Core Proteome, the Kinet oplastida core has 5,000 orthologous groups and 67.92% (3,396/5000) are Kinetoplastida Specific, besides 46.29% (1,592/3,396) of these orthologs are annotated as “hypothetical”. Apicomplexa Core Proteome has 986 orthologous groups and 27.82% (224/986) are Apicomplexa Specific whereas 40.63% (92/224) were classified as hypothetical proteins. Entamoeba Core Proteome has 5,915 orthologous groups and 75.08% (4,441/5,915) of these groups are Entamoeba Specific and 65.41% (2,905/4441) were annotated as hypothetic al. Analyzing the paralogs, Trichomonas vaginalis was the specie s that presented the highest number of inparalogs groups, 2,933 and also showed 948 co - orthologs totalizing 3881 paralogs. A deep look into the Kinetoplastida order showed that Trypanosoma cruzi has the highest duplication number, totalizing 5777 paralogs, 4963 co - orthologs and 814 inparalogs groups . The L. amazonensis analysis resulted in 29,670,588 bases assembled, and 8802 CDS identified. Comparative analysis into the Leishman ia genus showed that these 6 species share 7016 ortologs, whilst L. amazonensis and L. mexicana has the biggest number of specific orthologs and L. braziliensis biggest number of inparalogs. Phylogenomic analysis showed the expected L. amazonensis taxonomi c position together with L. mexicana forming the “Mexicana complex” and the New and Old Leishmania (L . ). spp. separation. Potential analagous proteins were found between L. amazonensis and H omo sapiens , and also into the L. amazonensis proteome. Finally, R NAi analysis showed that L. amazonensis , probably, do not have functional RNAi pathway 2016-04-12T12:41:56Z 2016-04-12T12:41:56Z 2013 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis TSCHOEKE, D. A. Genômica comparativa de protozoários 2013. 237f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2013 https://www.arca.fiocruz.br/handle/icict/13702 por info:eu-repo/semantics/openAccess reponame:Repositório Institucional da FIOCRUZ instname:Fundação Oswaldo Cruz instacron:FIOCRUZ