Summary: | This thesis presents a new model to protein function prediction using support
vector machines, a machine learning approach trained using structural
parameters calculated from protein tertiary structure. The model is different
from the others paradigms because it is not necessary to search for similarities
against the others known proteins in public databases by alignments. In this
way, the model is able to associate functional relationships among proteins
with no similarities and it could be used when all other methods fail or when
the user don t want to use the concept of similarity in function predictions.
The proof that the model is valid was accomplished analyzing its performance
with unknown proteins, i.e proteins not used in the training set. The validation
approach used a set of binding proteins. === Fundação de Amparo a Pesquisa do Estado de Alagoas === Este trabalho apresenta um novo modelo capaz de prever a função de proteínas
utilizando máquinas de vetor de suporte, um método de aprendizagem
de máquina treinado usando parâmetros estruturais calculados a partir da
conformação espacial da própria proteína. O modelo difere do paradigma comum
de predição por não ser necessário calcular similaridades por meio de
alinhamentos entre a proteína que se deseja prever a função e as proteínas
de função conhecida presentes nos bancos de dados públicos. Dessa forma,
o modelo é capaz de associar função às proteínas que não possuem qualquer
semelhança com proteínas conhecidas, podendo ser usado quando todos os
outros métodos falham ou quando não se deseja utilizar o conceito de similaridade
na predição da função. A justificativa de que o modelo é válido foi
realizada analisando sua performance ao prever funções de proteínas desconhecidas,
proteínas não usadas no treinamento, utilizando como estudo de
caso um conjunto de proteínas de ligação.
|