Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos
Orientador: Sérgio Roberto Peres Line === Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba === Made available in DSpace on 2018-08-22T18:59:49Z (GMT). No. of bitstreams: 1 Urioste_EduardoArcanjo_M.pdf: 1274507 bytes, checksum: 0f7136d4dabaf0e810ad2bd...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
[s.n.]
2013
|
Subjects: | |
Online Access: | URIOSTE, Eduardo Arcanjo. Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos. 2013. 63 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba, Piracicaba, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/290036>. Acesso em: 22 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/290036 |
id |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-290036 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
topic |
Regiões 5' não traduzidas Mutação Curva ROC Biologia computacional 5' untranslated regions Mutation ROC curve Computational biology |
spellingShingle |
Regiões 5' não traduzidas Mutação Curva ROC Biologia computacional 5' untranslated regions Mutation ROC curve Computational biology Urioste, Eduardo Arcanjo, 1989- Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos |
description |
Orientador: Sérgio Roberto Peres Line === Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba === Made available in DSpace on 2018-08-22T18:59:49Z (GMT). No. of bitstreams: 1
Urioste_EduardoArcanjo_M.pdf: 1274507 bytes, checksum: 0f7136d4dabaf0e810ad2bdf1b2ee815 (MD5)
Previous issue date: 2013 === Resumo: Estima-se que cada indivíduo carregue cerca de 120 a 430 variantes raras em regiões UTRs (Abecasis et al, 2012). Apesar da tolerância a variação na região 5' UTR, a patofisiologia de várias doenças está ligada a mutações na mesma (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010), sendo necessário o entendimento a determinação dos mecanismos regulatórios. O objetivo deste trabalho é descobrir assinaturas genéticas encontradas no contexto genômico de mutações pontuais de região 5' UTR que permitam prever o impacto funcional de outras variações pontuais na mesma região. As mutações, causadora de doença, foram selecionadas do banco de dados do Human Gene Mutation Database (HGMD) (Stenson et al, 2008); e os polimorfismos, de impacto funcional desconhecido, foram obtidos no banco de dados NHLBI Grand Opportunity Exome Sequencing Project (ESP), sendo originados do trabalho de Tenessen et al (2012). No total foram utilizadas 235 mutações e 21.542 polimorfismos. Para as variações foram calculados parâmetros de variação da estabilidade da estrutura secundária do contexto das variações (??Gfolding), presença de sítios de ligação de fatores de transcrição (JASPAR), tipo de variação (transição/transversão, tipoV), distância do início da sequência codificante (DiSC), distância do início de transcrição (DiTr) e conservação filogenética por distância de Levenshtein do contexto (Lev). A estatística foi calculada pelos testes de Wilcoxon e Binomial. A partir destes foram gerados modelos de regressão logísticos analisados através de curva ROC. Os parâmetros ??Gfolding máximo, tipoV, DiSC, e Lev permitiram a distinção significativa (? = 0,05) entres os polimorfismos e as mutações permitindo modelos explicativos, mas incompletos (área da Curva ROC 0, 772). ??Gfolding max. indicou uma relação entre as mutações e entre estruturas secundárias mais estáveis geradas pelas mesmas. Os parâmetros Lev e tipoV sugerem a origem das mutações como resultantes de hotspots. O parâmetro DiSC indicou regiões com provável funcionalidade. Apesar de não ter sido possível estabelecer relação causal entre os parâmetros e o impacto funcional das variações, encontrou-se correlações importantes === Abstract: It is estimated that each individual carries about 120 to 430 rare variante in the UTR regions (Abecasis et al, 2012). Despite the increased tolerance towards variations in 5' UTR region, the patho-phisiology of several diseases is linked to its mutations (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010). Therefore it is necessary the understanding and the determination of the regulatory elements. The objective of this study is the discovery of genetic signatures found in the genomic context of disease causing point mutations in 5' UTR, thus allowing the prediction of the functional impact of other point variations in the same region. The disease causing mutations were selected from Human Gene Mutation Database (HGMD) (Stenson et al, 2008). The polymorphisms of unknown functional impact were obtained from the NHLBI Grand Opportunity Exome Sequencing Project (ESP), originated from the work of Tenessen et al (2012). A total of 235 mutations and 21,542 polymorphisms were used. For each variation, parameters related with the differences of the variation's context folding stability (??Gfolding), presence of transcription factor binding sites (JASPAR), type of variation (transition/transversion, tipoV), distance from coding sequence start (DiSC), distance from transcription start site (DiTr) and phylogenetic conservations by distance of Levenshtein from wild type to variant context (Lev). The statistical test was done by Wilcoxon and Binomial. Logistical regressions models were generated from the parameters and its performance was evaluated by a ROC curve. The parameters maximal ??Gfolding, tipoV, logarithm of DiSC and Lev allowed a significant distinction (? = 0,05) between the groups, generating models of reasonable explanation but incomplete (area under the ROC curve 0,772). Maximal ??Gfolding showed a relationship between mutations and stable secondary structures generated by them. Lev and tipoV suggested the origin of the mutation from hotspots. The DiSC parameter identified regions with possible functionality. While it was not possible to establish any clear causal relationship between the parameters and the functional impact of the variations, important correlations were found === Mestrado === Histologia e Embriologia === Mestre em Biologia Buco-Dental |
author2 |
UNIVERSIDADE ESTADUAL DE CAMPINAS |
author_facet |
UNIVERSIDADE ESTADUAL DE CAMPINAS Urioste, Eduardo Arcanjo, 1989- |
author |
Urioste, Eduardo Arcanjo, 1989- |
author_sort |
Urioste, Eduardo Arcanjo, 1989- |
title |
Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos |
title_short |
Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos |
title_full |
Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos |
title_fullStr |
Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos |
title_full_unstemmed |
Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos |
title_sort |
parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' utr em genes humanos |
publisher |
[s.n.] |
publishDate |
2013 |
url |
URIOSTE, Eduardo Arcanjo. Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos. 2013. 63 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba, Piracicaba, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/290036>. Acesso em: 22 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/290036 |
work_keys_str_mv |
AT uriosteeduardoarcanjo1989 parametrosbioinformaticosdocontextogenomicocomopreditoresdoefeitofuncionaldesubstituicoespontuaisnasequencia5utremgeneshumanos AT uriosteeduardoarcanjo1989 bioinformaticparametersofgenomiccontextaspredictorsoffunctionalimpactinpointsubstitutionsofhumangene5utr |
_version_ |
1718883371002626048 |
spelling |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-2900362019-01-21T21:21:05Z Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos Bioinformatic parameters of genomic context as predictors of functional impact in point substitutions of human gene 5' UTR Urioste, Eduardo Arcanjo, 1989- UNIVERSIDADE ESTADUAL DE CAMPINAS Line, Sergio Roberto Peres, 1963- Cervigne, Nilva de Karla Caldas, Danielle Gregorio Gomes Regiões 5' não traduzidas Mutação Curva ROC Biologia computacional 5' untranslated regions Mutation ROC curve Computational biology Orientador: Sérgio Roberto Peres Line Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba Made available in DSpace on 2018-08-22T18:59:49Z (GMT). No. of bitstreams: 1 Urioste_EduardoArcanjo_M.pdf: 1274507 bytes, checksum: 0f7136d4dabaf0e810ad2bdf1b2ee815 (MD5) Previous issue date: 2013 Resumo: Estima-se que cada indivíduo carregue cerca de 120 a 430 variantes raras em regiões UTRs (Abecasis et al, 2012). Apesar da tolerância a variação na região 5' UTR, a patofisiologia de várias doenças está ligada a mutações na mesma (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010), sendo necessário o entendimento a determinação dos mecanismos regulatórios. O objetivo deste trabalho é descobrir assinaturas genéticas encontradas no contexto genômico de mutações pontuais de região 5' UTR que permitam prever o impacto funcional de outras variações pontuais na mesma região. As mutações, causadora de doença, foram selecionadas do banco de dados do Human Gene Mutation Database (HGMD) (Stenson et al, 2008); e os polimorfismos, de impacto funcional desconhecido, foram obtidos no banco de dados NHLBI Grand Opportunity Exome Sequencing Project (ESP), sendo originados do trabalho de Tenessen et al (2012). No total foram utilizadas 235 mutações e 21.542 polimorfismos. Para as variações foram calculados parâmetros de variação da estabilidade da estrutura secundária do contexto das variações (??Gfolding), presença de sítios de ligação de fatores de transcrição (JASPAR), tipo de variação (transição/transversão, tipoV), distância do início da sequência codificante (DiSC), distância do início de transcrição (DiTr) e conservação filogenética por distância de Levenshtein do contexto (Lev). A estatística foi calculada pelos testes de Wilcoxon e Binomial. A partir destes foram gerados modelos de regressão logísticos analisados através de curva ROC. Os parâmetros ??Gfolding máximo, tipoV, DiSC, e Lev permitiram a distinção significativa (? = 0,05) entres os polimorfismos e as mutações permitindo modelos explicativos, mas incompletos (área da Curva ROC 0, 772). ??Gfolding max. indicou uma relação entre as mutações e entre estruturas secundárias mais estáveis geradas pelas mesmas. Os parâmetros Lev e tipoV sugerem a origem das mutações como resultantes de hotspots. O parâmetro DiSC indicou regiões com provável funcionalidade. Apesar de não ter sido possível estabelecer relação causal entre os parâmetros e o impacto funcional das variações, encontrou-se correlações importantes Abstract: It is estimated that each individual carries about 120 to 430 rare variante in the UTR regions (Abecasis et al, 2012). Despite the increased tolerance towards variations in 5' UTR region, the patho-phisiology of several diseases is linked to its mutations (Cazzola & Skoda, 2000; Reynolds, 2002; Chatterjee & Pal, 2009; Wethmar et al 2010). Therefore it is necessary the understanding and the determination of the regulatory elements. The objective of this study is the discovery of genetic signatures found in the genomic context of disease causing point mutations in 5' UTR, thus allowing the prediction of the functional impact of other point variations in the same region. The disease causing mutations were selected from Human Gene Mutation Database (HGMD) (Stenson et al, 2008). The polymorphisms of unknown functional impact were obtained from the NHLBI Grand Opportunity Exome Sequencing Project (ESP), originated from the work of Tenessen et al (2012). A total of 235 mutations and 21,542 polymorphisms were used. For each variation, parameters related with the differences of the variation's context folding stability (??Gfolding), presence of transcription factor binding sites (JASPAR), type of variation (transition/transversion, tipoV), distance from coding sequence start (DiSC), distance from transcription start site (DiTr) and phylogenetic conservations by distance of Levenshtein from wild type to variant context (Lev). The statistical test was done by Wilcoxon and Binomial. Logistical regressions models were generated from the parameters and its performance was evaluated by a ROC curve. The parameters maximal ??Gfolding, tipoV, logarithm of DiSC and Lev allowed a significant distinction (? = 0,05) between the groups, generating models of reasonable explanation but incomplete (area under the ROC curve 0,772). Maximal ??Gfolding showed a relationship between mutations and stable secondary structures generated by them. Lev and tipoV suggested the origin of the mutation from hotspots. The DiSC parameter identified regions with possible functionality. While it was not possible to establish any clear causal relationship between the parameters and the functional impact of the variations, important correlations were found Mestrado Histologia e Embriologia Mestre em Biologia Buco-Dental 2013 2018-08-22T18:59:49Z 2018-08-22T18:59:49Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis URIOSTE, Eduardo Arcanjo. Parâmetros bioinformáticos do contexto genômico como preditores do efeito funcional de substituições pontuais na sequência 5' UTR em genes humanos. 2013. 63 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Odontologia de Piracicaba, Piracicaba, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/290036>. Acesso em: 22 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/290036 por info:eu-repo/semantics/openAccess 63 f. : il. application/pdf [s.n.] Universidade Estadual de Campinas. Faculdade de Odontologia de Piracicaba Programa de Pós-Graduação em Biologia Buco-Dental reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP |