Modelos Escondidos de Markov para Classificação de Proteínas
Made available in DSpace on 2014-06-12T15:59:16Z (GMT). No. of bitstreams: 2 arquivo4987_1.pdf: 3134708 bytes, checksum: d9f9442a382a92b7f968dc2caeb95891 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2002 === A Biologia Molecular apresenta-se...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade Federal de Pernambuco
2014
|
Subjects: | |
Online Access: | https://repositorio.ufpe.br/handle/123456789/2561 |
id |
ndltd-IBICT-oai-repositorio.ufpe.br-123456789-2561 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-repositorio.ufpe.br-123456789-25612019-01-21T19:03:57Z Modelos Escondidos de Markov para Classificação de Proteínas Mesquita Brasil Khouri, Cátia Silva Guimarães, Katia Modelos Escondidos de Markov Determinação da melhor seqüência de estados Ajuste dos parâmetros do modelo Made available in DSpace on 2014-06-12T15:59:16Z (GMT). No. of bitstreams: 2 arquivo4987_1.pdf: 3134708 bytes, checksum: d9f9442a382a92b7f968dc2caeb95891 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2002 A Biologia Molecular apresenta-se como uma área da Biologia bastante fértil em aplicações de técnicas computacionais. A estrutura das moléculas de ácidos nucléicos e proteínas, composta de partículas alinhadas ao longo de uma cadeia, permite-lhes serem tratadas computacionalmente como seqüências de símbolos de um alfabeto finito. O estudo das similaridades existentes entre seqüências distintas de proteínas que desempenham a mesma função pode ajudar a traçar caminhos evolucionários comuns e descobrir semelhanças entre diferentes organismos, que podem levar à compreensão de famílias inteiras, contribuindo para a definição de mecanismos gerais que regem as formas de vida na Terra. Modelos Escondidos de Markov HMMs, têm-se apresentado como uma excelente técnica para a comparação de seqüências de proteínas, suportada por uma forte fundamentação matemática. Este processo de modelagem é baseado nas características estatísticas do objeto de estudo, o qual é visto como um processo aleatório parametrizado, cujos parâmetros podem ser determinados de uma maneira bem definida e precisa. No projeto de um HMM, há três problemas fundamentais a serem resolvidos: (1) Avaliação da probabilidade de uma seqüência de observações, dado o HMM; (2) Determinação da melhor seqüência de estados (a mais provável); (3) Ajuste dos parâmetros do modelo, de acordo com a seqüência observada. Neste trabalho é apresentada uma arquitetura de HMM para modelagem de famílias de proteínas, que é implementada com uma técnica de aprendizagem de máquina a qual permite que os parâmetros do modelo, tais como penalidades por remoções, inserções e substituições, sejam aprendidos durante a construção do modelo, sem a introdução de conhecimento prévio. Para aplicar a técnica, foi desenvolvida uma ferramenta para construção de um HMM capaz de classificar seqüências de proteínas. Foram realizados experimentos com três famílias de proteínas, a saber, globinas, proteinoquinases e GTPases. Para cada família, um HMM foi treinado usando um conjunto de seqüências daquela família. Os resultados dos experimentos mostram que a técnica HMM é capaz de explorar informações estatísticas contidas em uma grande quantidade de seqüências de proteínas de uma mesma família. Os HMM s construídos são capazes de distinguir com um alto grau de precisão seqüências membros de seqüências não membros das famílias modeladas 2014-06-12T15:59:16Z 2014-06-12T15:59:16Z 2002 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis Mesquita Brasil Khouri, Cátia; Silva Guimarães, Katia. Modelos Escondidos de Markov para Classificação de Proteínas. 2002. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2002. https://repositorio.ufpe.br/handle/123456789/2561 por info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Modelos Escondidos de Markov Determinação da melhor seqüência de estados Ajuste dos parâmetros do modelo |
spellingShingle |
Modelos Escondidos de Markov Determinação da melhor seqüência de estados Ajuste dos parâmetros do modelo Mesquita Brasil Khouri, Cátia Modelos Escondidos de Markov para Classificação de Proteínas |
description |
Made available in DSpace on 2014-06-12T15:59:16Z (GMT). No. of bitstreams: 2
arquivo4987_1.pdf: 3134708 bytes, checksum: d9f9442a382a92b7f968dc2caeb95891 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2002 === A Biologia Molecular apresenta-se como uma área da Biologia bastante fértil em
aplicações de técnicas computacionais. A estrutura das moléculas de ácidos nucléicos e proteínas,
composta de partículas alinhadas ao longo de uma cadeia, permite-lhes serem tratadas
computacionalmente como seqüências de símbolos de um alfabeto finito. O estudo das
similaridades existentes entre seqüências distintas de proteínas que desempenham a mesma
função pode ajudar a traçar caminhos evolucionários comuns e descobrir semelhanças entre
diferentes organismos, que podem levar à compreensão de famílias inteiras, contribuindo para a
definição de mecanismos gerais que regem as formas de vida na Terra.
Modelos Escondidos de Markov HMMs, têm-se apresentado como uma excelente
técnica para a comparação de seqüências de proteínas, suportada por uma forte fundamentação
matemática. Este processo de modelagem é baseado nas características estatísticas do objeto de
estudo, o qual é visto como um processo aleatório parametrizado, cujos parâmetros podem ser
determinados de uma maneira bem definida e precisa. No projeto de um HMM, há três problemas
fundamentais a serem resolvidos: (1) Avaliação da probabilidade de uma seqüência de
observações, dado o HMM; (2) Determinação da melhor seqüência de estados (a mais provável);
(3) Ajuste dos parâmetros do modelo, de acordo com a seqüência observada. Neste trabalho é
apresentada uma arquitetura de HMM para modelagem de famílias de proteínas, que é
implementada com uma técnica de aprendizagem de máquina a qual permite que os parâmetros do
modelo, tais como penalidades por remoções, inserções e substituições, sejam aprendidos durante a
construção do modelo, sem a introdução de conhecimento prévio.
Para aplicar a técnica, foi desenvolvida uma ferramenta para construção de um HMM
capaz de classificar seqüências de proteínas. Foram realizados experimentos com três famílias de
proteínas, a saber, globinas, proteinoquinases e GTPases. Para cada família, um HMM foi
treinado usando um conjunto de seqüências daquela família. Os resultados dos experimentos
mostram que a técnica HMM é capaz de explorar informações estatísticas contidas em uma
grande quantidade de seqüências de proteínas de uma mesma família. Os HMM s construídos são
capazes de distinguir com um alto grau de precisão seqüências membros de seqüências não
membros das famílias modeladas |
author2 |
Silva Guimarães, Katia |
author_facet |
Silva Guimarães, Katia Mesquita Brasil Khouri, Cátia |
author |
Mesquita Brasil Khouri, Cátia |
author_sort |
Mesquita Brasil Khouri, Cátia |
title |
Modelos Escondidos de Markov para Classificação de Proteínas |
title_short |
Modelos Escondidos de Markov para Classificação de Proteínas |
title_full |
Modelos Escondidos de Markov para Classificação de Proteínas |
title_fullStr |
Modelos Escondidos de Markov para Classificação de Proteínas |
title_full_unstemmed |
Modelos Escondidos de Markov para Classificação de Proteínas |
title_sort |
modelos escondidos de markov para classificação de proteínas |
publisher |
Universidade Federal de Pernambuco |
publishDate |
2014 |
url |
https://repositorio.ufpe.br/handle/123456789/2561 |
work_keys_str_mv |
AT mesquitabrasilkhouricatia modelosescondidosdemarkovparaclassificacaodeproteinas |
_version_ |
1718859772711665664 |