Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais
Orientadores: Goran Neshich, João Alexandre Ribeiro Gonçalves Barbosa === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia === Made available in DSpace on 2018-08-21T21:50:32Z (GMT). No. of bitstreams: 1 Pereira_JoseGeraldodeCarvalho_M.pdf: 10985777 bytes, checksum:...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
[s.n.]
2012
|
Subjects: | |
Online Access: | PEREIRA, José Geraldo de Carvalho. Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais. 2012. 106 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/316806>. Acesso em: 21 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/316806 |
id |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-316806 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
topic |
Mapeamento de interação de proteínas Hot spots Varredura por alalinas Protein interaction mapping Hot spots Alaline scanning |
spellingShingle |
Mapeamento de interação de proteínas Hot spots Varredura por alalinas Protein interaction mapping Hot spots Alaline scanning Pereira, José Geraldo de Carvalho, 1984- Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
description |
Orientadores: Goran Neshich, João Alexandre Ribeiro Gonçalves Barbosa === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia === Made available in DSpace on 2018-08-21T21:50:32Z (GMT). No. of bitstreams: 1
Pereira_JoseGeraldodeCarvalho_M.pdf: 10985777 bytes, checksum: 2610df8bda1ef229c4bcdc8c6c5d8325 (MD5)
Previous issue date: 2012 === Resumo: A propriedade das proteínas de se ligarem umas as outras de forma altamente específica, formando complexos estáveis, é uma característica fundamental para todos os processos biológicos. Uma melhor compreensão da formação do complexo abre perspectivas para muitas aplicações práticas, entre elas o design racional de novos fármacos. Trabalhos anteriores demonstraram, através de experimentos de varredura por alaninas, que um pequeno número de resíduos das interfaces protéicas contribui com a maior parte da energia de ligação e por isso foram chamados de hot spots. Devido à importância desses resíduos para as interações proteína-proteína, diversos métodos computacionais têm sido propostos para predizer os hot spots complementando assim o procedimento experimental. Entre esses, estão métodos physics-based como dinâmica molecular, e também métodos knowledge-based, onde dados experimentais são utilizados para treinar métodos computacionais que aprendem as regras para classificar corretamente os hot spots e usados posteriormente para classificar novos casos em estruturas de complexos protéicos. Entre os algoritmos de aprendizado computacionais mais utilizados estão árvores de decisão, redes neurais, máquinas de vetor de suporte. Nesse trabalho, desenvolvemos métodos de predição de hot spots utilizando máquinas de vetor de suporte, que foram abastecidas na entrada com um conjunto de 186 descritores estruturais extraídos do banco de dados STING_DB e também com 112 novos descritores propostos neste trabalho. Os métodos propostos nesse trabalho apresentaram desempenho superior aos métodos de predição de hot spots mais conhecidos da literatura, como KFC, Minerva, Rosetta e FOLDEF. Além disso, a análise estatística dos descritores e também a seleção dos descritores mais eficientes na tarefa de classificar hot spots permitiu que observássemos diversas características que são distintas entre resíduos que são hot spots e os que não são. Entre estas características, a entalpia de hidratação ao redor do resíduo sugere que essa região é mais hidrofílica em hot spots. Essa região, que para hot spots é denominada de anel-O, tem a função de impedir o contato do solvente com o hot spot e por isso, alguns autores acreditavam tratar-se de uma região hidrofóbica, algo que os resultados deste trabalho não confirmaram. Futuramente, os novos descritores propostos neste trabalho serão agregados ao STING_DB e o método de predição de hot spots será integrado ao STING permitindo a predição de hot spots de todos os complexos protéicos depositados no Protein Data Bank (PDB) assim como de complexos protéicos fornecidos pelo usuário === Abstract: The property of the proteins to bind each other in a highly specific way, forming stable complexes, is a key feature for all biological processes. A better understanding of the formation of protein complexes provides many practical applications, including the rational design of new drugs. Through experiments of alanine scanning, it was shown that a small number of residues belonging to protein interfaces contribute decisively to the binding energy and so were called hot spots. Because of the importance of these residues for protein-protein interactions many computational methods have been proposed to predict the hot spots and thus complement the experimental procedure. These include physics-based methods such as molecular dynamics and also knowledge-based methods where experimental data are used to train computational methods that learn the rules for correctly classifying the hot spots and are then used to classify new cases in structures of protein complexes. Among the computational learning algorithms most frequently used are decision trees, neural networks, support vector machines, among others. In this work, we developed methods to predict hot spots using support vector machines, using at the input 186 structural descriptors extracted from the STING_DB and 112 new descriptors proposed in this work. The methods proposed here showed superior performance to methods of predicting hot spots best known from the literature, such as KFC, Minerva, Rosetta and FOLDEF. In addition, statistical analysis of the descriptors and also the selection of the descriptors more efficient in the task of classifying hot spots allowed us to observe several characteristics that are distinct for residues that are hot spots. Among these features, the enthalpy of hydration suggests that the region around hot spots is more hydrophilic. This region, which for hot spots is called O-ring, serves to prevent the contact of the solvent with the hot spot and therefore some authors believe that this was a hydrophobic region whereas results presented here show otherwise. In future, the new descriptors described in this work will be added to the STING_DB and the method of prediction of hot spots will be integrated with STING allowing the prediction of hot spots of all protein complexes deposited in the Protein Data Bank (PDB) as well as protein complexes supplied by the user === Mestrado === Bioinformatica === Mestre em Genética e Biologia Molecular |
author2 |
UNIVERSIDADE ESTADUAL DE CAMPINAS |
author_facet |
UNIVERSIDADE ESTADUAL DE CAMPINAS Pereira, José Geraldo de Carvalho, 1984- |
author |
Pereira, José Geraldo de Carvalho, 1984- |
author_sort |
Pereira, José Geraldo de Carvalho, 1984- |
title |
Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
title_short |
Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
title_full |
Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
title_fullStr |
Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
title_full_unstemmed |
Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
title_sort |
caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais |
publisher |
[s.n.] |
publishDate |
2012 |
url |
PEREIRA, José Geraldo de Carvalho. Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais. 2012. 106 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/316806>. Acesso em: 21 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/316806 |
work_keys_str_mv |
AT pereirajosegeraldodecarvalho1984 caracterizacaodosaminoacidosdainterfaceproteinaproteinacommaiorcontribuicaonaenergiadeligacaoesuapredicaoapartirdosdadosestruturais AT pereirajosegeraldodecarvalho1984 characterizationoftheaminoacidsfromproteinproteininterfacewiththehighestcontributiontothebindingenergyanditspredictionfromstructuraldata |
_version_ |
1718883047079673856 |
spelling |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-3168062019-01-21T21:19:26Z Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais Characterization of the amino acids from protein-protein interface with the highest contribution to the binding energy and its prediction from structural data Pereira, José Geraldo de Carvalho, 1984- UNIVERSIDADE ESTADUAL DE CAMPINAS Barbosa, João Alexandre Ribeiro Gonçalves Neshich, Goran Ambrosio, Andre Luís Berteli Aparicio, Ricardo Mapeamento de interação de proteínas Hot spots Varredura por alalinas Protein interaction mapping Hot spots Alaline scanning Orientadores: Goran Neshich, João Alexandre Ribeiro Gonçalves Barbosa Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia Made available in DSpace on 2018-08-21T21:50:32Z (GMT). No. of bitstreams: 1 Pereira_JoseGeraldodeCarvalho_M.pdf: 10985777 bytes, checksum: 2610df8bda1ef229c4bcdc8c6c5d8325 (MD5) Previous issue date: 2012 Resumo: A propriedade das proteínas de se ligarem umas as outras de forma altamente específica, formando complexos estáveis, é uma característica fundamental para todos os processos biológicos. Uma melhor compreensão da formação do complexo abre perspectivas para muitas aplicações práticas, entre elas o design racional de novos fármacos. Trabalhos anteriores demonstraram, através de experimentos de varredura por alaninas, que um pequeno número de resíduos das interfaces protéicas contribui com a maior parte da energia de ligação e por isso foram chamados de hot spots. Devido à importância desses resíduos para as interações proteína-proteína, diversos métodos computacionais têm sido propostos para predizer os hot spots complementando assim o procedimento experimental. Entre esses, estão métodos physics-based como dinâmica molecular, e também métodos knowledge-based, onde dados experimentais são utilizados para treinar métodos computacionais que aprendem as regras para classificar corretamente os hot spots e usados posteriormente para classificar novos casos em estruturas de complexos protéicos. Entre os algoritmos de aprendizado computacionais mais utilizados estão árvores de decisão, redes neurais, máquinas de vetor de suporte. Nesse trabalho, desenvolvemos métodos de predição de hot spots utilizando máquinas de vetor de suporte, que foram abastecidas na entrada com um conjunto de 186 descritores estruturais extraídos do banco de dados STING_DB e também com 112 novos descritores propostos neste trabalho. Os métodos propostos nesse trabalho apresentaram desempenho superior aos métodos de predição de hot spots mais conhecidos da literatura, como KFC, Minerva, Rosetta e FOLDEF. Além disso, a análise estatística dos descritores e também a seleção dos descritores mais eficientes na tarefa de classificar hot spots permitiu que observássemos diversas características que são distintas entre resíduos que são hot spots e os que não são. Entre estas características, a entalpia de hidratação ao redor do resíduo sugere que essa região é mais hidrofílica em hot spots. Essa região, que para hot spots é denominada de anel-O, tem a função de impedir o contato do solvente com o hot spot e por isso, alguns autores acreditavam tratar-se de uma região hidrofóbica, algo que os resultados deste trabalho não confirmaram. Futuramente, os novos descritores propostos neste trabalho serão agregados ao STING_DB e o método de predição de hot spots será integrado ao STING permitindo a predição de hot spots de todos os complexos protéicos depositados no Protein Data Bank (PDB) assim como de complexos protéicos fornecidos pelo usuário Abstract: The property of the proteins to bind each other in a highly specific way, forming stable complexes, is a key feature for all biological processes. A better understanding of the formation of protein complexes provides many practical applications, including the rational design of new drugs. Through experiments of alanine scanning, it was shown that a small number of residues belonging to protein interfaces contribute decisively to the binding energy and so were called hot spots. Because of the importance of these residues for protein-protein interactions many computational methods have been proposed to predict the hot spots and thus complement the experimental procedure. These include physics-based methods such as molecular dynamics and also knowledge-based methods where experimental data are used to train computational methods that learn the rules for correctly classifying the hot spots and are then used to classify new cases in structures of protein complexes. Among the computational learning algorithms most frequently used are decision trees, neural networks, support vector machines, among others. In this work, we developed methods to predict hot spots using support vector machines, using at the input 186 structural descriptors extracted from the STING_DB and 112 new descriptors proposed in this work. The methods proposed here showed superior performance to methods of predicting hot spots best known from the literature, such as KFC, Minerva, Rosetta and FOLDEF. In addition, statistical analysis of the descriptors and also the selection of the descriptors more efficient in the task of classifying hot spots allowed us to observe several characteristics that are distinct for residues that are hot spots. Among these features, the enthalpy of hydration suggests that the region around hot spots is more hydrophilic. This region, which for hot spots is called O-ring, serves to prevent the contact of the solvent with the hot spot and therefore some authors believe that this was a hydrophobic region whereas results presented here show otherwise. In future, the new descriptors described in this work will be added to the STING_DB and the method of prediction of hot spots will be integrated with STING allowing the prediction of hot spots of all protein complexes deposited in the Protein Data Bank (PDB) as well as protein complexes supplied by the user Mestrado Bioinformatica Mestre em Genética e Biologia Molecular 2012 2018-08-21T21:50:32Z 2018-08-21T21:50:32Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis PEREIRA, José Geraldo de Carvalho. Caracterização dos aminoácidos da interface proteína-proteína com maior contribuição na energia de ligação e sua predição a partir dos dados estruturais. 2012. 106 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/316806>. Acesso em: 21 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/316806 por info:eu-repo/semantics/openAccess 106 p. : il. application/pdf [s.n.] Universidade Estadual de Campinas. Instituto de Biologia Programa de Pós-Graduação em Genética e Biologia Molecular reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP |