Summary: | La bio-informatique est un champ pluridisciplinaire qui utilise la biologie,
l’informatique, la physique et les mathématiques pour résoudre des problèmes posés par la
biologie. L’une des thématiques de la bio-informatique est l’analyse des séquences
génomiques et la prédiction de gènes d’ARN non codants. Les ARN non codants sont des
molécules d’ARN qui sont transcrites mais pas traduites en protéine et qui ont une fonction
dans la cellule. Trouver des gènes d’ARN non codants par des techniques de biochimie et
de biologie moléculaire est assez difficile et relativement coûteux. Ainsi, la prédiction des
gènes d’ARNnc par des méthodes bio-informatiques est un enjeu important. Cette
recherche décrit un travail d’analyse informatique pour chercher des nouveaux ARNnc
chez le pathogène Candida albicans et d’une validation expérimentale. Nous avons utilisé
comme stratégie une analyse informatique combinant plusieurs logiciels d’identification
d’ARNnc. Nous avons validé un sous-ensemble des prédictions informatiques avec une
expérience de puces à ADN couvrant 1979 régions du génome. Grace à cette expérience
nous avons identifié 62 nouveaux transcrits chez Candida albicans. Ce travail aussi permit
le développement d’une méthode d’analyse pour des puces à ADN de type tiling array. Ce
travail présente également une tentation d’améliorer de la prédiction d’ARNnc avec une
méthode se basant sur la recherche de motifs d’ARN dans les séquences. === Bioinformatics is a multidisciplinary field that uses biology, computer science, physics and
mathematics to solve problems in biology. One of the topics of bioinformatics is the
analysis of genomic sequences and prediction of genes from non-coding RNA (ncRNA).
The non-coding RNAs are RNA molecules that are transcribed but not translated into
protein and have a function in the cell. The use of biochemistry and molecular biology
techniques in order to find non-coding RNA genes is rather difficult and relatively
expensive. Thus, the prediction of genes by bioinformatics methods is an important issue.
This research describes a computer analysis to search for new ncRNA in the pathogen
Candida albicans and an experimental validation. The strategy used was to combine
several algorithms and to validate a subset of computer predictions with a microarray
experience covering 1979 regions of the genome. We have identified 62 new transcripts in
Candida albicans. We have also developed an analytical method for tiling array and
attempted to improve the prediction of ncRNAs this with a method based on the search of
RNA motifs in the sequences.
|