MYOP: um arcabouço para predição de genes ab initio\"

A demanda por abordagens eficientes para o problema de reconhecer a estrutura de cada gene numa sequência genômica motivou a implementação de um grande número de programas preditores de genes. Fizemos uma análise dos programas de sucesso com abordagem probabilística e reconhecemos semelhanças na imp...

Full description

Bibliographic Details
Main Author: Kashiwabara, Andre Yoshiaki
Other Authors: Durham, Alan Mitchell
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2007
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45134/tde-25112009-151237/
id ndltd-usp.br-oai-teses.usp.br-tde-25112009-151237
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-25112009-1512372019-05-09T21:24:52Z MYOP: um arcabouço para predição de genes ab initio\" MYOP: A framework for building ab initio gene predictors Kashiwabara, Andre Yoshiaki bioinformática Bioinformatics cadeia de Markov oculta generalizada. gene prediction generalized hidden Markov model predição de genes A demanda por abordagens eficientes para o problema de reconhecer a estrutura de cada gene numa sequência genômica motivou a implementação de um grande número de programas preditores de genes. Fizemos uma análise dos programas de sucesso com abordagem probabilística e reconhecemos semelhanças na implementação dos mesmos. A maior parte desses programas utiliza a cadeia oculta generalizada de Markov (GHMM - generalized hiddenMarkov model) como um modelo de gene. Percebemos que muitos preditores têm a arquitetura da GHMM fixada no código-fonte, dificultando a investigação de novas abordagens. Devido a essa dificuldade e pelas semelhanças entre os programas atuais, implementamos o sistema MYOP (Make Your Own Predictor) que tem como objetivo fornecer um ambiente flexível o qual permite avaliar rapidamente cada modelo de gene. Mostramos a utilidade da ferramenta através da implementação e avaliação de 96 modelos de genes em que cada modelo é formado por um conjunto de estados e cada estado tem uma distribuição de duração e um outro modelo probabilístico. Verificamos que nem sempre um modelo probabilísticomais sofisticado fornece um preditor melhor, mostrando a relevância das experimentações e a importância de um sistema como o MYOP. The demand for efficient approaches for the gene structure prediction has motivated the implementation of different programs. In this work, we have analyzed successful programs that apply the probabilistic approach. We have observed similarities between different implementations, the same mathematical framework called generalized hidden Markov chain (GHMM) is applied. One problem with these implementations is that they maintain fixed GHMM architectures that are hard-coded. Due to this problem and similarities between the programs, we have implemented the MYOP framework (Make Your Own Predictor) with the objective of providing a flexible environment that allows the rapid evaluation of each gene model. We have demonstrated the utility of this tool through the implementation and evaluation of 96 gene models in which each model has a set of states and each state has a duration distribution and a probabilistic model. We have shown that a sophisticated probabilisticmodel is not sufficient to obtain better predictor, showing the experimentation relevance and the importance of a system as MYOP. Biblioteca Digitais de Teses e Dissertações da USP Durham, Alan Mitchell 2007-03-23 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/45/45134/tde-25112009-151237/ pt Liberar o conteúdo para acesso público.
collection NDLTD
language pt
format Others
sources NDLTD
topic bioinformática
Bioinformatics
cadeia de Markov oculta generalizada.
gene prediction
generalized hidden Markov model
predição de genes
spellingShingle bioinformática
Bioinformatics
cadeia de Markov oculta generalizada.
gene prediction
generalized hidden Markov model
predição de genes
Kashiwabara, Andre Yoshiaki
MYOP: um arcabouço para predição de genes ab initio\"
description A demanda por abordagens eficientes para o problema de reconhecer a estrutura de cada gene numa sequência genômica motivou a implementação de um grande número de programas preditores de genes. Fizemos uma análise dos programas de sucesso com abordagem probabilística e reconhecemos semelhanças na implementação dos mesmos. A maior parte desses programas utiliza a cadeia oculta generalizada de Markov (GHMM - generalized hiddenMarkov model) como um modelo de gene. Percebemos que muitos preditores têm a arquitetura da GHMM fixada no código-fonte, dificultando a investigação de novas abordagens. Devido a essa dificuldade e pelas semelhanças entre os programas atuais, implementamos o sistema MYOP (Make Your Own Predictor) que tem como objetivo fornecer um ambiente flexível o qual permite avaliar rapidamente cada modelo de gene. Mostramos a utilidade da ferramenta através da implementação e avaliação de 96 modelos de genes em que cada modelo é formado por um conjunto de estados e cada estado tem uma distribuição de duração e um outro modelo probabilístico. Verificamos que nem sempre um modelo probabilísticomais sofisticado fornece um preditor melhor, mostrando a relevância das experimentações e a importância de um sistema como o MYOP. === The demand for efficient approaches for the gene structure prediction has motivated the implementation of different programs. In this work, we have analyzed successful programs that apply the probabilistic approach. We have observed similarities between different implementations, the same mathematical framework called generalized hidden Markov chain (GHMM) is applied. One problem with these implementations is that they maintain fixed GHMM architectures that are hard-coded. Due to this problem and similarities between the programs, we have implemented the MYOP framework (Make Your Own Predictor) with the objective of providing a flexible environment that allows the rapid evaluation of each gene model. We have demonstrated the utility of this tool through the implementation and evaluation of 96 gene models in which each model has a set of states and each state has a duration distribution and a probabilistic model. We have shown that a sophisticated probabilisticmodel is not sufficient to obtain better predictor, showing the experimentation relevance and the importance of a system as MYOP.
author2 Durham, Alan Mitchell
author_facet Durham, Alan Mitchell
Kashiwabara, Andre Yoshiaki
author Kashiwabara, Andre Yoshiaki
author_sort Kashiwabara, Andre Yoshiaki
title MYOP: um arcabouço para predição de genes ab initio\"
title_short MYOP: um arcabouço para predição de genes ab initio\"
title_full MYOP: um arcabouço para predição de genes ab initio\"
title_fullStr MYOP: um arcabouço para predição de genes ab initio\"
title_full_unstemmed MYOP: um arcabouço para predição de genes ab initio\"
title_sort myop: um arcabouço para predição de genes ab initio\"
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2007
url http://www.teses.usp.br/teses/disponiveis/45/45134/tde-25112009-151237/
work_keys_str_mv AT kashiwabaraandreyoshiaki myopumarcaboucoparapredicaodegenesabinitio
AT kashiwabaraandreyoshiaki myopaframeworkforbuildingabinitiogenepredictors
_version_ 1719073525172535296