Computational identification of genes: ab initio and comparative approaches
El trabajo que aquí se presenta, estudia el reconocimiento de las señales que delimitan y definen los genes que codifican para proteínas, así como su aplicabilidad en los programas de predicción de genes. La tesis que aquí se presenta, también explora la utilitzación de la genómica comparativa para...
Main Author: | |
---|---|
Other Authors: | |
Format: | Doctoral Thesis |
Language: | English |
Published: |
Universitat Pompeu Fabra
2004
|
Subjects: | |
Online Access: | http://hdl.handle.net/10803/7082 http://nbn-resolving.de/urn:isbn:8468927503 |
id |
ndltd-TDX_UPF-oai-www.tdx.cat-10803-7082 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-TDX_UPF-oai-www.tdx.cat-10803-70822013-07-11T03:41:52ZComputational identification of genes: ab initio and comparative approachesParra Farré, Genísanotación de genomasgene predictiongeneidsgp2 y modelos estadísticosbioinformaticsgenómica comparativagenome annotationcomparative genomicsspicing signalscoding statisticsgeneidsgp2 and statistical modelsestadísticos codificantesbioinformáticaseñales de splicingpredicción de genes575El trabajo que aquí se presenta, estudia el reconocimiento de las señales que delimitan y definen los genes que codifican para proteínas, así como su aplicabilidad en los programas de predicción de genes. La tesis que aquí se presenta, también explora la utilitzación de la genómica comparativa para mejorar la identificación de genes en diferentes especies simultaniamente. También se explica el desarrollo de dos programas de predicción computacional de genes: geneid y sgp2. El programa geneid identifica los genes codificados en una secuencia anónima de DNA basandose en sus propiedades intrínsecas (principalmente las señales de splicing y el uso diferencial de codones). sgp2 permite utilitzar la comparación entre dos genomas, que han de estar a una cierta distancia evolutiva óptima, para mejorar la predicción de genes, bajo la hipotesis que las regiones codificantes están mas conservadas que las regiones que no codifican para proteínas.The motivation of this thesis is to give a little insight in how genes are encoded and recognized by the cell machinery and to use this information to find genes in unannotated genomic sequences. One of the objectives is the development of tools to identify eukaryotic genes through the modeling and recognition of their intrinsic signals and properties. This thesis addresses another problem: how the sequence of related genomes can contribute to the identification of genes. The value of comparative genomics is illustrated by the sequencing of the mouse genome for the purpose of annotating the human genome. Comparative gene predictions programs exploit this data under the assumption that conserved regions between related species correspond to functional regions (coding genes among them). Thus, this thesis also describes a gene prediction program that combines ab initio gene prediction with comparative information between two genomes to improve the accuracy of the predictions.Universitat Pompeu FabraGuigó Serra, RodericUniversitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut2004-12-03info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://hdl.handle.net/10803/7082urn:isbn:8468927503TDX (Tesis Doctorals en Xarxa)engADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.info:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
English |
format |
Doctoral Thesis |
sources |
NDLTD |
topic |
anotación de genomas gene prediction geneid sgp2 y modelos estadísticos bioinformatics genómica comparativa genome annotation comparative genomics spicing signals coding statistics geneid sgp2 and statistical models estadísticos codificantes bioinformática señales de splicing predicción de genes 575 |
spellingShingle |
anotación de genomas gene prediction geneid sgp2 y modelos estadísticos bioinformatics genómica comparativa genome annotation comparative genomics spicing signals coding statistics geneid sgp2 and statistical models estadísticos codificantes bioinformática señales de splicing predicción de genes 575 Parra Farré, Genís Computational identification of genes: ab initio and comparative approaches |
description |
El trabajo que aquí se presenta, estudia el reconocimiento de las señales que delimitan y definen los genes que codifican para proteínas, así como su aplicabilidad en los programas de predicción de genes. La tesis que aquí se presenta, también explora la utilitzación de la genómica comparativa para mejorar la identificación de genes en diferentes especies simultaniamente. También se explica el desarrollo de dos programas de predicción computacional de genes: geneid y sgp2. El programa geneid identifica los genes codificados en una secuencia anónima de DNA basandose en sus propiedades intrínsecas (principalmente las señales de splicing y el uso diferencial de codones). sgp2 permite utilitzar la comparación entre dos genomas, que han de estar a una cierta distancia evolutiva óptima, para mejorar la predicción de genes, bajo la hipotesis que las regiones codificantes están mas conservadas que las regiones que no codifican para proteínas. === The motivation of this thesis is to give a little insight in how genes are encoded and recognized by the cell machinery and to use this information to find genes in unannotated genomic sequences. One of the objectives is the development of tools to identify eukaryotic genes through the modeling and recognition of their intrinsic signals and properties. This thesis addresses another problem: how the sequence of related genomes can contribute to the identification of genes. The value of comparative genomics is illustrated by the sequencing of the mouse genome for the purpose of annotating the human genome. Comparative gene predictions programs exploit this data under the assumption that conserved regions between related species correspond to functional regions (coding genes among them). Thus, this thesis also describes a gene prediction program that combines ab initio gene prediction with comparative information between two genomes to improve the accuracy of the predictions. |
author2 |
Guigó Serra, Roderic |
author_facet |
Guigó Serra, Roderic Parra Farré, Genís |
author |
Parra Farré, Genís |
author_sort |
Parra Farré, Genís |
title |
Computational identification of genes: ab initio and comparative approaches |
title_short |
Computational identification of genes: ab initio and comparative approaches |
title_full |
Computational identification of genes: ab initio and comparative approaches |
title_fullStr |
Computational identification of genes: ab initio and comparative approaches |
title_full_unstemmed |
Computational identification of genes: ab initio and comparative approaches |
title_sort |
computational identification of genes: ab initio and comparative approaches |
publisher |
Universitat Pompeu Fabra |
publishDate |
2004 |
url |
http://hdl.handle.net/10803/7082 http://nbn-resolving.de/urn:isbn:8468927503 |
work_keys_str_mv |
AT parrafarregenis computationalidentificationofgenesabinitioandcomparativeapproaches |
_version_ |
1716592665409093632 |