Modelos Escondidos de Markov para Classificação de Proteínas

Made available in DSpace on 2014-06-12T15:59:16Z (GMT). No. of bitstreams: 2 arquivo4987_1.pdf: 3134708 bytes, checksum: d9f9442a382a92b7f968dc2caeb95891 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2002 === A Biologia Molecular apresenta-se...

Full description

Bibliographic Details
Main Author: Mesquita Brasil Khouri, Cátia
Other Authors: Silva Guimarães, Katia
Language:Portuguese
Published: Universidade Federal de Pernambuco 2014
Subjects:
Online Access:https://repositorio.ufpe.br/handle/123456789/2561
id ndltd-IBICT-oai-repositorio.ufpe.br-123456789-2561
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufpe.br-123456789-25612019-01-21T19:03:57Z Modelos Escondidos de Markov para Classificação de Proteínas Mesquita Brasil Khouri, Cátia Silva Guimarães, Katia Modelos Escondidos de Markov Determinação da melhor seqüência de estados Ajuste dos parâmetros do modelo Made available in DSpace on 2014-06-12T15:59:16Z (GMT). No. of bitstreams: 2 arquivo4987_1.pdf: 3134708 bytes, checksum: d9f9442a382a92b7f968dc2caeb95891 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2002 A Biologia Molecular apresenta-se como uma área da Biologia bastante fértil em aplicações de técnicas computacionais. A estrutura das moléculas de ácidos nucléicos e proteínas, composta de partículas alinhadas ao longo de uma cadeia, permite-lhes serem tratadas computacionalmente como seqüências de símbolos de um alfabeto finito. O estudo das similaridades existentes entre seqüências distintas de proteínas que desempenham a mesma função pode ajudar a traçar caminhos evolucionários comuns e descobrir semelhanças entre diferentes organismos, que podem levar à compreensão de famílias inteiras, contribuindo para a definição de mecanismos gerais que regem as formas de vida na Terra. Modelos Escondidos de Markov HMMs, têm-se apresentado como uma excelente técnica para a comparação de seqüências de proteínas, suportada por uma forte fundamentação matemática. Este processo de modelagem é baseado nas características estatísticas do objeto de estudo, o qual é visto como um processo aleatório parametrizado, cujos parâmetros podem ser determinados de uma maneira bem definida e precisa. No projeto de um HMM, há três problemas fundamentais a serem resolvidos: (1) Avaliação da probabilidade de uma seqüência de observações, dado o HMM; (2) Determinação da melhor seqüência de estados (a mais provável); (3) Ajuste dos parâmetros do modelo, de acordo com a seqüência observada. Neste trabalho é apresentada uma arquitetura de HMM para modelagem de famílias de proteínas, que é implementada com uma técnica de aprendizagem de máquina a qual permite que os parâmetros do modelo, tais como penalidades por remoções, inserções e substituições, sejam aprendidos durante a construção do modelo, sem a introdução de conhecimento prévio. Para aplicar a técnica, foi desenvolvida uma ferramenta para construção de um HMM capaz de classificar seqüências de proteínas. Foram realizados experimentos com três famílias de proteínas, a saber, globinas, proteinoquinases e GTPases. Para cada família, um HMM foi treinado usando um conjunto de seqüências daquela família. Os resultados dos experimentos mostram que a técnica HMM é capaz de explorar informações estatísticas contidas em uma grande quantidade de seqüências de proteínas de uma mesma família. Os HMM s construídos são capazes de distinguir com um alto grau de precisão seqüências membros de seqüências não membros das famílias modeladas 2014-06-12T15:59:16Z 2014-06-12T15:59:16Z 2002 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis Mesquita Brasil Khouri, Cátia; Silva Guimarães, Katia. Modelos Escondidos de Markov para Classificação de Proteínas. 2002. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2002. https://repositorio.ufpe.br/handle/123456789/2561 por info:eu-repo/semantics/openAccess Universidade Federal de Pernambuco reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE
collection NDLTD
language Portuguese
sources NDLTD
topic Modelos Escondidos de Markov
Determinação da melhor seqüência de estados
Ajuste dos parâmetros do modelo
spellingShingle Modelos Escondidos de Markov
Determinação da melhor seqüência de estados
Ajuste dos parâmetros do modelo
Mesquita Brasil Khouri, Cátia
Modelos Escondidos de Markov para Classificação de Proteínas
description Made available in DSpace on 2014-06-12T15:59:16Z (GMT). No. of bitstreams: 2 arquivo4987_1.pdf: 3134708 bytes, checksum: d9f9442a382a92b7f968dc2caeb95891 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2002 === A Biologia Molecular apresenta-se como uma área da Biologia bastante fértil em aplicações de técnicas computacionais. A estrutura das moléculas de ácidos nucléicos e proteínas, composta de partículas alinhadas ao longo de uma cadeia, permite-lhes serem tratadas computacionalmente como seqüências de símbolos de um alfabeto finito. O estudo das similaridades existentes entre seqüências distintas de proteínas que desempenham a mesma função pode ajudar a traçar caminhos evolucionários comuns e descobrir semelhanças entre diferentes organismos, que podem levar à compreensão de famílias inteiras, contribuindo para a definição de mecanismos gerais que regem as formas de vida na Terra. Modelos Escondidos de Markov HMMs, têm-se apresentado como uma excelente técnica para a comparação de seqüências de proteínas, suportada por uma forte fundamentação matemática. Este processo de modelagem é baseado nas características estatísticas do objeto de estudo, o qual é visto como um processo aleatório parametrizado, cujos parâmetros podem ser determinados de uma maneira bem definida e precisa. No projeto de um HMM, há três problemas fundamentais a serem resolvidos: (1) Avaliação da probabilidade de uma seqüência de observações, dado o HMM; (2) Determinação da melhor seqüência de estados (a mais provável); (3) Ajuste dos parâmetros do modelo, de acordo com a seqüência observada. Neste trabalho é apresentada uma arquitetura de HMM para modelagem de famílias de proteínas, que é implementada com uma técnica de aprendizagem de máquina a qual permite que os parâmetros do modelo, tais como penalidades por remoções, inserções e substituições, sejam aprendidos durante a construção do modelo, sem a introdução de conhecimento prévio. Para aplicar a técnica, foi desenvolvida uma ferramenta para construção de um HMM capaz de classificar seqüências de proteínas. Foram realizados experimentos com três famílias de proteínas, a saber, globinas, proteinoquinases e GTPases. Para cada família, um HMM foi treinado usando um conjunto de seqüências daquela família. Os resultados dos experimentos mostram que a técnica HMM é capaz de explorar informações estatísticas contidas em uma grande quantidade de seqüências de proteínas de uma mesma família. Os HMM s construídos são capazes de distinguir com um alto grau de precisão seqüências membros de seqüências não membros das famílias modeladas
author2 Silva Guimarães, Katia
author_facet Silva Guimarães, Katia
Mesquita Brasil Khouri, Cátia
author Mesquita Brasil Khouri, Cátia
author_sort Mesquita Brasil Khouri, Cátia
title Modelos Escondidos de Markov para Classificação de Proteínas
title_short Modelos Escondidos de Markov para Classificação de Proteínas
title_full Modelos Escondidos de Markov para Classificação de Proteínas
title_fullStr Modelos Escondidos de Markov para Classificação de Proteínas
title_full_unstemmed Modelos Escondidos de Markov para Classificação de Proteínas
title_sort modelos escondidos de markov para classificação de proteínas
publisher Universidade Federal de Pernambuco
publishDate 2014
url https://repositorio.ufpe.br/handle/123456789/2561
work_keys_str_mv AT mesquitabrasilkhouricatia modelosescondidosdemarkovparaclassificacaodeproteinas
_version_ 1718859772711665664