Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica

B. diazoefficiens CPAC 7 e B. japonicum CPAC 15 são estirpes brasileiras de Bradyrhizobium que apresentam grande relevância para o cultivo da soja, pois são capazes de fornecer nitrogênio para a produção desta leguminosa através do processo de fixação biológica de nitrogênio (FBN), uma técnica suste...

Full description

Bibliographic Details
Main Author: Carvalho, Gesiele Almeida Barros de
Other Authors: Lopes, Fabricio Martins
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2016
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/95/95131/tde-17042019-144658/
id ndltd-usp.br-oai-teses.usp.br-tde-17042019-144658
record_format oai_dc
collection NDLTD
language pt
format Others
sources NDLTD
topic Análise de sequências
Atypical regions
Bioinformática
Bioinformatics
Comparative genomics of prokaryotes
Fixação de nitrogênio
Genômica comparativa de procariotos
Hypothetical proteins
Insertion sequences
Interação planta-bactéria
Máxima entropia
Maximum entropy
Nitrogen fixation
Plant-bacteria interaction
Proteínas hipotéticas
Regiões atípicas
Sequence analysis
Sequências de inserção
spellingShingle Análise de sequências
Atypical regions
Bioinformática
Bioinformatics
Comparative genomics of prokaryotes
Fixação de nitrogênio
Genômica comparativa de procariotos
Hypothetical proteins
Insertion sequences
Interação planta-bactéria
Máxima entropia
Maximum entropy
Nitrogen fixation
Plant-bacteria interaction
Proteínas hipotéticas
Regiões atípicas
Sequence analysis
Sequências de inserção
Carvalho, Gesiele Almeida Barros de
Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica
description B. diazoefficiens CPAC 7 e B. japonicum CPAC 15 são estirpes brasileiras de Bradyrhizobium que apresentam grande relevância para o cultivo da soja, pois são capazes de fornecer nitrogênio para a produção desta leguminosa através do processo de fixação biológica de nitrogênio (FBN), uma técnica sustentável e de baixo custo. Por esse motivo, tais bactérias são de grande interesse, e seu estudo contribui na compreensão do processo complexo e orquestrado por um conjunto de genes específicos que culmina no estabelecimento da simbiose. A estirpe CPAC 7 possui maior eficiência em fixar N2 , e a CPAC 15 destaca-se pela sua competitividade. Recentemente, o genoma de cada uma foi sequenciado na tentativa de conhecer seu conteúdo gênico e identificar os fatores genéticos responsáveis pelas diferenças no desempenho simbiótico. Apesar de ter sido encontrado alguns rearranjos, os genoma mostraram-se sintênicos na sua maioria. Entretanto, o fato de haver muitas transposases ao redor dos genes, principalmente na ilha simbiótica, e devido a presença de muitos genes hipotéticos, representando uma limitação no conhecimento, nos motivou a realizar o presente estudo, onde exploramos estes dois genomas. Portanto, os objetivos deste estudo foram de definir a população de elementos de transposição (TEs) que compõe estes genomas, avaliar se os elementos completos podem estar impactando os genes de alguma forma; explorar as proteínas hipotéticas, tentando identificar novas funções que possam estar associadas com a interação soja-Bradyrhizobium e apontá-las para estudos experimentais futuros; e ainda explorar os genes exclusivos das regiões atípicas dos genomas, sendo que para isso, nós também desenvolvemos uma nova metodologia, baseada na máxima entropia (ME), que pode ser utilizada em novos estudos genômicos a partir da simples sequência nucleotídica. Todas as análises deste estudo foram realizadas in silico. Estudando os TEs, identificamos 33 novas sequências de inserção, sendo que algumas destacaram-se por terem potencial impacto nos genes associados com a simbiose destas bactérias, como nopAN, nopAG, rhcU, modC e hypB. Explorar as proteínas hipotéticas nos permitiu reduzir a porcentagem de hipotéticas dos genomas. Adicionamos novas informações à 1.204 proteínas, das quais muitas apresentaram similaridade com proteínas comprovadamente associadas com a interação planta-bactéria, em condições de simbiose e/ou patogenicidade, como proteínas envolvidas na motilidade e adesão celular, fatores de virulência, proteínas secretoras e efetoras, entre outras. Além disso, a metodologia ME, desenvolvida neste estudo com o intuito de direcionar análises genômicas para regiões atípicas, quando comparada com outras ferramentas existentes, mostrou-se superior em termos de eficiência e tempo de execução computacional. Nas regiões genômicas apontadas pela ME nos dois genomas de interesse, identificamos 269 genes exclusivos de CPAC 7 e 368 de CPAC 15, sendo que destacamos aqueles com potencial relação com as diferenças simbióticas das estirpes, como o gene fixW, noeE, rtxA e nex18. Assim, os resultados obtidos neste trabalho vêm expandir nosso conhecimento sobre os genomas destas estirpes. Destacando ainda, importantes diferenças que podem estar associadas com a habilidade simbiótica de cada bactéria. === B. diazoefficiens CPAC 7 and B. japonicum CPAC 15 are Brazilian Bradyrhizobium strains of great importance for soybean cultivation, since when in a symbiotic state they provide nitrogen for the crop through the biological nitrogen fixation process (BNF), a sustainable technique and low cost. For this reason, such bacteria represent great interest and have been widely studied, once the symbiotic establishment is a complex process and orchestrated by a specific set of genes. The CPAC 7 strain has a higher efficiency to fix N2 , while CPAC 15 stands out for its competitiveness. Recently, their genomes were sequenced in an attempt to gain knowledge about their gene content and to identify the genetic factors responsible for differences in their symbiotic performance. Despite having identified some rearrangements, the majority of genomes showed syntenic. However, the fact that there are many transposases around the genes, especially in symbiotic island, and due to the presence of many hypothetical genes, representing a limitation on knowledge, motivated us to conduct this study, which explored these two important genomes. Therefore, the objectives of this study were to define the population of transposable elements (TEs) present in these genomes and to verify whether such TEs could be impacting the genes somehow; to study the hypothetical proteins, trying to identify new features that may be associated with the soybean-Bradyrhizobium interaction and point them for future experimental studies; and to explore the exclusive genes from atypical regions of both genomes, and for that, we have also developed a new methodology, based on maximum entropy (ME), which can be used in new genomic studies. All analyzes in this study were performed in silico. Studying the TEs, we identified 33 new insertion sequences, and some stood out for having potential impact on genes associated with the symbiosis of these bacteria, such as nopAN, nopAG, rhcU, modC and hypB. As a consequence of improving the annotation of hypothetical proteins we were able to reduce the hypothetical percentage. Among these, we add new information to 1,204 proteins, many of which had similarity to proteins with involvement in the plant-bacteria interaction, in symbiosis and/or pathogenicity conditions, such as proteins involved in cell motility and adhesion, virulence factors, secretion proteins, effectors, among others. Moreover, the ME methodology developed in this study to direct genomic analysis to atypical regions, compared with other existing tools, it was superior in efficiency and execution time. In the genomic regions identified by the ME in both Bradyrhizobium genomes, we identified 269 exclusive genes of CPAC 7 and 368 of CPAC 15, we highlighted those with potential involvement with symbiotic differences of strains, as fixW, noeE, rtxA and nex18. Thus, the results obtained in this study come to expand our knowledge about the genomes of these important bacteria. Finally, differences were identified as potential targets to be associated with the symbiotic ability of each strain to be futher studied.
author2 Lopes, Fabricio Martins
author_facet Lopes, Fabricio Martins
Carvalho, Gesiele Almeida Barros de
author Carvalho, Gesiele Almeida Barros de
author_sort Carvalho, Gesiele Almeida Barros de
title Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica
title_short Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica
title_full Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica
title_fullStr Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica
title_full_unstemmed Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica
title_sort análise computacional dos genomas de duas estirpes brasileiras de bradyrhizobium de importância econômica
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2016
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-17042019-144658/
work_keys_str_mv AT carvalhogesielealmeidabarrosde analisecomputacionaldosgenomasdeduasestirpesbrasileirasdebradyrhizobiumdeimportanciaeconomica
AT carvalhogesielealmeidabarrosde computationalanalysisofgenomesoftwobrazilianbradyrhizobiumstrainsofeconomicimportance
_version_ 1719201727187517440
spelling ndltd-usp.br-oai-teses.usp.br-tde-17042019-1446582019-06-08T04:34:40Z Análise computacional dos genomas de duas estirpes brasileiras de Bradyrhizobium de importância econômica Computational analysis of genomes of two Brazilian Bradyrhizobium strains of economic importance Carvalho, Gesiele Almeida Barros de Análise de sequências Atypical regions Bioinformática Bioinformatics Comparative genomics of prokaryotes Fixação de nitrogênio Genômica comparativa de procariotos Hypothetical proteins Insertion sequences Interação planta-bactéria Máxima entropia Maximum entropy Nitrogen fixation Plant-bacteria interaction Proteínas hipotéticas Regiões atípicas Sequence analysis Sequências de inserção B. diazoefficiens CPAC 7 e B. japonicum CPAC 15 são estirpes brasileiras de Bradyrhizobium que apresentam grande relevância para o cultivo da soja, pois são capazes de fornecer nitrogênio para a produção desta leguminosa através do processo de fixação biológica de nitrogênio (FBN), uma técnica sustentável e de baixo custo. Por esse motivo, tais bactérias são de grande interesse, e seu estudo contribui na compreensão do processo complexo e orquestrado por um conjunto de genes específicos que culmina no estabelecimento da simbiose. A estirpe CPAC 7 possui maior eficiência em fixar N2 , e a CPAC 15 destaca-se pela sua competitividade. Recentemente, o genoma de cada uma foi sequenciado na tentativa de conhecer seu conteúdo gênico e identificar os fatores genéticos responsáveis pelas diferenças no desempenho simbiótico. Apesar de ter sido encontrado alguns rearranjos, os genoma mostraram-se sintênicos na sua maioria. Entretanto, o fato de haver muitas transposases ao redor dos genes, principalmente na ilha simbiótica, e devido a presença de muitos genes hipotéticos, representando uma limitação no conhecimento, nos motivou a realizar o presente estudo, onde exploramos estes dois genomas. Portanto, os objetivos deste estudo foram de definir a população de elementos de transposição (TEs) que compõe estes genomas, avaliar se os elementos completos podem estar impactando os genes de alguma forma; explorar as proteínas hipotéticas, tentando identificar novas funções que possam estar associadas com a interação soja-Bradyrhizobium e apontá-las para estudos experimentais futuros; e ainda explorar os genes exclusivos das regiões atípicas dos genomas, sendo que para isso, nós também desenvolvemos uma nova metodologia, baseada na máxima entropia (ME), que pode ser utilizada em novos estudos genômicos a partir da simples sequência nucleotídica. Todas as análises deste estudo foram realizadas in silico. Estudando os TEs, identificamos 33 novas sequências de inserção, sendo que algumas destacaram-se por terem potencial impacto nos genes associados com a simbiose destas bactérias, como nopAN, nopAG, rhcU, modC e hypB. Explorar as proteínas hipotéticas nos permitiu reduzir a porcentagem de hipotéticas dos genomas. Adicionamos novas informações à 1.204 proteínas, das quais muitas apresentaram similaridade com proteínas comprovadamente associadas com a interação planta-bactéria, em condições de simbiose e/ou patogenicidade, como proteínas envolvidas na motilidade e adesão celular, fatores de virulência, proteínas secretoras e efetoras, entre outras. Além disso, a metodologia ME, desenvolvida neste estudo com o intuito de direcionar análises genômicas para regiões atípicas, quando comparada com outras ferramentas existentes, mostrou-se superior em termos de eficiência e tempo de execução computacional. Nas regiões genômicas apontadas pela ME nos dois genomas de interesse, identificamos 269 genes exclusivos de CPAC 7 e 368 de CPAC 15, sendo que destacamos aqueles com potencial relação com as diferenças simbióticas das estirpes, como o gene fixW, noeE, rtxA e nex18. Assim, os resultados obtidos neste trabalho vêm expandir nosso conhecimento sobre os genomas destas estirpes. Destacando ainda, importantes diferenças que podem estar associadas com a habilidade simbiótica de cada bactéria. B. diazoefficiens CPAC 7 and B. japonicum CPAC 15 are Brazilian Bradyrhizobium strains of great importance for soybean cultivation, since when in a symbiotic state they provide nitrogen for the crop through the biological nitrogen fixation process (BNF), a sustainable technique and low cost. For this reason, such bacteria represent great interest and have been widely studied, once the symbiotic establishment is a complex process and orchestrated by a specific set of genes. The CPAC 7 strain has a higher efficiency to fix N2 , while CPAC 15 stands out for its competitiveness. Recently, their genomes were sequenced in an attempt to gain knowledge about their gene content and to identify the genetic factors responsible for differences in their symbiotic performance. Despite having identified some rearrangements, the majority of genomes showed syntenic. However, the fact that there are many transposases around the genes, especially in symbiotic island, and due to the presence of many hypothetical genes, representing a limitation on knowledge, motivated us to conduct this study, which explored these two important genomes. Therefore, the objectives of this study were to define the population of transposable elements (TEs) present in these genomes and to verify whether such TEs could be impacting the genes somehow; to study the hypothetical proteins, trying to identify new features that may be associated with the soybean-Bradyrhizobium interaction and point them for future experimental studies; and to explore the exclusive genes from atypical regions of both genomes, and for that, we have also developed a new methodology, based on maximum entropy (ME), which can be used in new genomic studies. All analyzes in this study were performed in silico. Studying the TEs, we identified 33 new insertion sequences, and some stood out for having potential impact on genes associated with the symbiosis of these bacteria, such as nopAN, nopAG, rhcU, modC and hypB. As a consequence of improving the annotation of hypothetical proteins we were able to reduce the hypothetical percentage. Among these, we add new information to 1,204 proteins, many of which had similarity to proteins with involvement in the plant-bacteria interaction, in symbiosis and/or pathogenicity conditions, such as proteins involved in cell motility and adhesion, virulence factors, secretion proteins, effectors, among others. Moreover, the ME methodology developed in this study to direct genomic analysis to atypical regions, compared with other existing tools, it was superior in efficiency and execution time. In the genomic regions identified by the ME in both Bradyrhizobium genomes, we identified 269 exclusive genes of CPAC 7 and 368 of CPAC 15, we highlighted those with potential involvement with symbiotic differences of strains, as fixW, noeE, rtxA and nex18. Thus, the results obtained in this study come to expand our knowledge about the genomes of these important bacteria. Finally, differences were identified as potential targets to be associated with the symbiotic ability of each strain to be futher studied. Biblioteca Digitais de Teses e Dissertações da USP Lopes, Fabricio Martins Sluys, Marie Anne van 2016-12-09 Tese de Doutorado application/pdf http://www.teses.usp.br/teses/disponiveis/95/95131/tde-17042019-144658/ pt Liberar o conteúdo para acesso público.