Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial
Orientadora : Profa. Dra. Liu Un Rigo === Orientador : Prof. Dr. Roberto Tadeu Raittz === Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 29/09/2014 === Inclui referências === Área de concentração: Saúde hu...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
2014
|
Subjects: | |
Online Access: | http://hdl.handle.net/1884/36878 |
id |
ndltd-IBICT-oai-dspace.c3sl.ufpr.br-1884-36878 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
topic |
Dissertações Bioinformática |
spellingShingle |
Dissertações Bioinformática Freire, Rodnei Damaceno Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial |
description |
Orientadora : Profa. Dra. Liu Un Rigo === Orientador : Prof. Dr. Roberto Tadeu Raittz === Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 29/09/2014 === Inclui referências === Área de concentração: Saúde humana e animal === Resumo:Sigma 70 ou sigma N constituem fatores complementares da RNA-polimerase, cuja principal função é promover a transcrição de genes procarióticos. No caso de Escherichia coli, o consenso da região -35 (TTGACA) e -10 (TATAAT) do fator sigma 70, está localizado a partir do intervalo da décima à trigésima quinta base a montante do sítio de início de transcrição e as bases mais conservadas estão localizadas nas posições -10 (A2 = 95% - T6 = 96%) e -35 (T1 = 82% - T2 = 84%). Propusemos neste trabalho identificar sequências promotoras de transcrição dependentes do fator sigma 70, utilizando um algoritmo que pré-seleciona candidatos aos promotores sigma 70 com base no padrão de conservação. Os candidatos são então classificados através de treinamento de rede artificial, com conjunto de sequências de promotores sigma 70 validados e um conjunto de sequências improváveis, geradas aleatoriamente. O método foi testado in silico no genoma da betaproteobactéria Herbaspirillum seropedicae SmR1, resultando em 4.998 sequências candidatas a promotores fator sigma 70. Deste grupo foram selecionados 288 candidatos a partir das regiões intergênicas de genes com alto nível de expressão. Isto tornou possível validar os resultados obtidos para identificação de sequências promotoras sigma 70 e propor uma sequência consenso para o promotor de transcrição sigma 70 em Herbaspirillum seropedicae SmR1. A metodologia utilizada para identificar os sítios de ligação sigma 70 mostrou-se eficaz na identificação de candidatos aos promotores sigma 70 em H. seropedicae SmR1 e possivelmente em outras proteobactérias. Palavras-chave: Herbaspirillum, Promotores, Fatores de Transcrição, sigma 70. === Abstract: Sigma 70 or sigma N constitute complementary sigma factors of RNA-polymerase, whose main function is to promote the transcription of prokaryotic genes. In the case of Escherichia coli, the consensus of the -35 region (TTGACA) and -10 (TATAAT) sigma 70 factor sequence, located from the range of the tenth to the thirty-fifth base upstream of the transcription start site and the bases more conserved are located at positions -10 (A2 = 95% - T6 = 96%) and -35 (T1 = 82% - T2 = 84%). We proposed in this work to identify promoter sequences of the sigma 70 dependent transcription factor, using an algorithm that pre-selects candidates for sigma 70 promoters based on conservation pattern. The candidates sequences are ranked using artificial neural network training set of validated sigma 70 promoter sequences and a set of randomly generated sequences. The method was tested in silico using the Betaproteobacteria Herbaspirillum seropedicae SMR1 genome, resulting in 4.998 candidate sequences for promoters to sigma 70 factor with standard conservation. Among these candidates 288 were manually selected from the intergenic regions of genes with high expression level. This made it possible to validate the results obtained for indentification of sigma 70 sequences and propose a consensus sequence for transcriptional promoter sigma 70 in Herbaspirillum seropedicae SMR1. The methodology used to predict sigma 70 binding sites showed effectiveness to identify candidates for sigma 70 promoters in H. seropedicae SMR1 and possibly in other proteobacteria.
Keywords: Herbaspirillum, Promoters, Transcription Factors, sigma 70. |
author2 |
Rigo, Liu Un |
author_facet |
Rigo, Liu Un Freire, Rodnei Damaceno |
author |
Freire, Rodnei Damaceno |
author_sort |
Freire, Rodnei Damaceno |
title |
Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial |
title_short |
Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial |
title_full |
Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial |
title_fullStr |
Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial |
title_full_unstemmed |
Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial |
title_sort |
identificação e análise de promotores sigma 70 no genoma de herbaspirillum seropedicae smr1 utilizando métodos de inteligência artificial |
publishDate |
2014 |
url |
http://hdl.handle.net/1884/36878 |
work_keys_str_mv |
AT freirerodneidamaceno identificacaoeanalisedepromotoressigma70nogenomadeherbaspirillumseropedicaesmr1utilizandometodosdeinteligenciaartificial |
_version_ |
1718647072043827200 |
spelling |
ndltd-IBICT-oai-dspace.c3sl.ufpr.br-1884-368782018-05-23T18:27:32Z Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificial Freire, Rodnei Damaceno Rigo, Liu Un Raittz, Roberto Tadeu Universidade Federal do Paraná. Setor de Tecnologia, Programa de Pós-Graduação em Bioinformática Dissertações Bioinformática Orientadora : Profa. Dra. Liu Un Rigo Orientador : Prof. Dr. Roberto Tadeu Raittz Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 29/09/2014 Inclui referências Área de concentração: Saúde humana e animal Resumo:Sigma 70 ou sigma N constituem fatores complementares da RNA-polimerase, cuja principal função é promover a transcrição de genes procarióticos. No caso de Escherichia coli, o consenso da região -35 (TTGACA) e -10 (TATAAT) do fator sigma 70, está localizado a partir do intervalo da décima à trigésima quinta base a montante do sítio de início de transcrição e as bases mais conservadas estão localizadas nas posições -10 (A2 = 95% - T6 = 96%) e -35 (T1 = 82% - T2 = 84%). Propusemos neste trabalho identificar sequências promotoras de transcrição dependentes do fator sigma 70, utilizando um algoritmo que pré-seleciona candidatos aos promotores sigma 70 com base no padrão de conservação. Os candidatos são então classificados através de treinamento de rede artificial, com conjunto de sequências de promotores sigma 70 validados e um conjunto de sequências improváveis, geradas aleatoriamente. O método foi testado in silico no genoma da betaproteobactéria Herbaspirillum seropedicae SmR1, resultando em 4.998 sequências candidatas a promotores fator sigma 70. Deste grupo foram selecionados 288 candidatos a partir das regiões intergênicas de genes com alto nível de expressão. Isto tornou possível validar os resultados obtidos para identificação de sequências promotoras sigma 70 e propor uma sequência consenso para o promotor de transcrição sigma 70 em Herbaspirillum seropedicae SmR1. A metodologia utilizada para identificar os sítios de ligação sigma 70 mostrou-se eficaz na identificação de candidatos aos promotores sigma 70 em H. seropedicae SmR1 e possivelmente em outras proteobactérias. Palavras-chave: Herbaspirillum, Promotores, Fatores de Transcrição, sigma 70. Abstract: Sigma 70 or sigma N constitute complementary sigma factors of RNA-polymerase, whose main function is to promote the transcription of prokaryotic genes. In the case of Escherichia coli, the consensus of the -35 region (TTGACA) and -10 (TATAAT) sigma 70 factor sequence, located from the range of the tenth to the thirty-fifth base upstream of the transcription start site and the bases more conserved are located at positions -10 (A2 = 95% - T6 = 96%) and -35 (T1 = 82% - T2 = 84%). We proposed in this work to identify promoter sequences of the sigma 70 dependent transcription factor, using an algorithm that pre-selects candidates for sigma 70 promoters based on conservation pattern. The candidates sequences are ranked using artificial neural network training set of validated sigma 70 promoter sequences and a set of randomly generated sequences. The method was tested in silico using the Betaproteobacteria Herbaspirillum seropedicae SMR1 genome, resulting in 4.998 candidate sequences for promoters to sigma 70 factor with standard conservation. Among these candidates 288 were manually selected from the intergenic regions of genes with high expression level. This made it possible to validate the results obtained for indentification of sigma 70 sequences and propose a consensus sequence for transcriptional promoter sigma 70 in Herbaspirillum seropedicae SMR1. The methodology used to predict sigma 70 binding sites showed effectiveness to identify candidates for sigma 70 promoters in H. seropedicae SMR1 and possibly in other proteobacteria. Keywords: Herbaspirillum, Promoters, Transcription Factors, sigma 70. 2014-12-11T14:08:48Z 2014-12-11T14:08:48Z 2014 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/1884/36878 por Disponível em formato digital info:eu-repo/semantics/openAccess 71f. : il. algumas color., grafs., tabs. application/pdf reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná instacron:UFPR |