Computational identification of genes: ab initio and comparative approaches

El trabajo que aquí se presenta, estudia el reconocimiento de las señales que delimitan y definen los genes que codifican para proteínas, así como su aplicabilidad en los programas de predicción de genes. La tesis que aquí se presenta, también explora la utilitzación de la genómica comparativa para...

Full description

Bibliographic Details
Main Author: Parra Farré, Genís
Other Authors: Guigó Serra, Roderic
Format: Doctoral Thesis
Language:English
Published: Universitat Pompeu Fabra 2004
Subjects:
575
Online Access:http://hdl.handle.net/10803/7082
http://nbn-resolving.de/urn:isbn:8468927503
id ndltd-TDX_UPF-oai-www.tdx.cat-10803-7082
record_format oai_dc
spelling ndltd-TDX_UPF-oai-www.tdx.cat-10803-70822013-07-11T03:41:52ZComputational identification of genes: ab initio and comparative approachesParra Farré, Genísanotación de genomasgene predictiongeneidsgp2 y modelos estadísticosbioinformaticsgenómica comparativagenome annotationcomparative genomicsspicing signalscoding statisticsgeneidsgp2 and statistical modelsestadísticos codificantesbioinformáticaseñales de splicingpredicción de genes575El trabajo que aquí se presenta, estudia el reconocimiento de las señales que delimitan y definen los genes que codifican para proteínas, así como su aplicabilidad en los programas de predicción de genes. La tesis que aquí se presenta, también explora la utilitzación de la genómica comparativa para mejorar la identificación de genes en diferentes especies simultaniamente. También se explica el desarrollo de dos programas de predicción computacional de genes: geneid y sgp2. El programa geneid identifica los genes codificados en una secuencia anónima de DNA basandose en sus propiedades intrínsecas (principalmente las señales de splicing y el uso diferencial de codones). sgp2 permite utilitzar la comparación entre dos genomas, que han de estar a una cierta distancia evolutiva óptima, para mejorar la predicción de genes, bajo la hipotesis que las regiones codificantes están mas conservadas que las regiones que no codifican para proteínas.The motivation of this thesis is to give a little insight in how genes are encoded and recognized by the cell machinery and to use this information to find genes in unannotated genomic sequences. One of the objectives is the development of tools to identify eukaryotic genes through the modeling and recognition of their intrinsic signals and properties. This thesis addresses another problem: how the sequence of related genomes can contribute to the identification of genes. The value of comparative genomics is illustrated by the sequencing of the mouse genome for the purpose of annotating the human genome. Comparative gene predictions programs exploit this data under the assumption that conserved regions between related species correspond to functional regions (coding genes among them). Thus, this thesis also describes a gene prediction program that combines ab initio gene prediction with comparative information between two genomes to improve the accuracy of the predictions.Universitat Pompeu FabraGuigó Serra, RodericUniversitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut2004-12-03info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://hdl.handle.net/10803/7082urn:isbn:8468927503TDX (Tesis Doctorals en Xarxa)engADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.info:eu-repo/semantics/openAccess
collection NDLTD
language English
format Doctoral Thesis
sources NDLTD
topic anotación de genomas
gene prediction
geneid
sgp2 y modelos estadísticos
bioinformatics
genómica comparativa
genome annotation
comparative genomics
spicing signals
coding statistics
geneid
sgp2 and statistical models
estadísticos codificantes
bioinformática
señales de splicing
predicción de genes
575
spellingShingle anotación de genomas
gene prediction
geneid
sgp2 y modelos estadísticos
bioinformatics
genómica comparativa
genome annotation
comparative genomics
spicing signals
coding statistics
geneid
sgp2 and statistical models
estadísticos codificantes
bioinformática
señales de splicing
predicción de genes
575
Parra Farré, Genís
Computational identification of genes: ab initio and comparative approaches
description El trabajo que aquí se presenta, estudia el reconocimiento de las señales que delimitan y definen los genes que codifican para proteínas, así como su aplicabilidad en los programas de predicción de genes. La tesis que aquí se presenta, también explora la utilitzación de la genómica comparativa para mejorar la identificación de genes en diferentes especies simultaniamente. También se explica el desarrollo de dos programas de predicción computacional de genes: geneid y sgp2. El programa geneid identifica los genes codificados en una secuencia anónima de DNA basandose en sus propiedades intrínsecas (principalmente las señales de splicing y el uso diferencial de codones). sgp2 permite utilitzar la comparación entre dos genomas, que han de estar a una cierta distancia evolutiva óptima, para mejorar la predicción de genes, bajo la hipotesis que las regiones codificantes están mas conservadas que las regiones que no codifican para proteínas. === The motivation of this thesis is to give a little insight in how genes are encoded and recognized by the cell machinery and to use this information to find genes in unannotated genomic sequences. One of the objectives is the development of tools to identify eukaryotic genes through the modeling and recognition of their intrinsic signals and properties. This thesis addresses another problem: how the sequence of related genomes can contribute to the identification of genes. The value of comparative genomics is illustrated by the sequencing of the mouse genome for the purpose of annotating the human genome. Comparative gene predictions programs exploit this data under the assumption that conserved regions between related species correspond to functional regions (coding genes among them). Thus, this thesis also describes a gene prediction program that combines ab initio gene prediction with comparative information between two genomes to improve the accuracy of the predictions.
author2 Guigó Serra, Roderic
author_facet Guigó Serra, Roderic
Parra Farré, Genís
author Parra Farré, Genís
author_sort Parra Farré, Genís
title Computational identification of genes: ab initio and comparative approaches
title_short Computational identification of genes: ab initio and comparative approaches
title_full Computational identification of genes: ab initio and comparative approaches
title_fullStr Computational identification of genes: ab initio and comparative approaches
title_full_unstemmed Computational identification of genes: ab initio and comparative approaches
title_sort computational identification of genes: ab initio and comparative approaches
publisher Universitat Pompeu Fabra
publishDate 2004
url http://hdl.handle.net/10803/7082
http://nbn-resolving.de/urn:isbn:8468927503
work_keys_str_mv AT parrafarregenis computationalidentificationofgenesabinitioandcomparativeapproaches
_version_ 1716592665409093632