DILATATION ET TRANSPOSITION SOUS CONTRAINTES PERCEPTIVES DES SIGNAUX AUDIO : APPLICATION AU TRANSFERT CINEMA-VIDEO

La coexistence de deux formats : cinéma à 24 images/s et vidéo à<br />25 images/s, implique l'accélération ou le ralentissement de la<br />bande-son lors du transfert d'un format vers l'autre. Ceci<br />provoque une modification temporelle du signal sonore, et par<...

Full description

Bibliographic Details
Main Author: PALLONE, Grégory
Language:FRE
Published: Université de la Méditerranée - Aix-Marseille II 2003
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00003363
http://tel.archives-ouvertes.fr/docs/00/13/19/92/PDF/tel-00003363.pdf
http://tel.archives-ouvertes.fr/docs/00/13/19/92/ANNEX/Soutenance_Pallone.ppt
Description
Summary:La coexistence de deux formats : cinéma à 24 images/s et vidéo à<br />25 images/s, implique l'accélération ou le ralentissement de la<br />bande-son lors du transfert d'un format vers l'autre. Ceci<br />provoque une modification temporelle du signal sonore, et par<br />conséquent une modification spectrale avec altération du timbre.<br />Les studios de post-production audiovisuelle souhaitent compenser<br />cet effet par l'application d'une transformation sonore adéquate.<br /><br />L'objectif de ce travail est de fournir à l'industrie<br />audiovisuelle un système permettant de pallier la modification de<br />timbre engendrée par le changement de vitesse de lecture. Ce<br />système se compose d'une part d'un algorithme de traitement et<br />d'autre part d'une machine sur lequel il est implanté.<br />L'algorithme est conçu et développé pour répondre aux contraintes<br />liées à la qualité sonore et à la compatibilité multicanal. La<br />machine, baptisée HARMO, est conçue spécifiquement par la société<br />GENESIS sur la base de processeurs de signaux numériques, et doit<br />répondre à la contrainte de temps-réel. Cet aspect "valorisation"<br />conduit à intégrer dans le projet les contraintes de coût et de<br />délai de réalisation.<br /><br />Un état de l'art basé sur une bibliographie quasi-exhaustive<br />aboutit à une classification originale des méthodes de dilatation<br />et de transposition existantes. Ceci nous amène à distinguer et à<br />étudier les méthodes classiques temporelles et fréquentielles, et<br />à introduire les méthodes temps-fréquence. Cette classification<br />est à la base de plusieurs méthodes innovantes :<br /><br />1. deux méthodes temps-fréquence dont l'analyse est adaptée à l'audition,<br /><br />2. deux méthodes couplées qui associent les avantages des méthodes temporelles et fréquentielles,<br /><br />3. une méthode temporelle basée sur une amélioration des méthodes existantes.<br /><br />Les algorithmes sont évalués grâce à une banque de sons-test<br />spécifiquement élaborée pour mettre en évidence les défauts<br />caractéristiques des algorithmes. Notre choix final s'est porté<br />sur l'approche temporelle, que nous optimisons par l'adjonction de<br />critères de segmentation basés sur l'autocorrélation normalisée et<br />la détection de transitoires. Cet algorithme s'intègre dans un<br />logiciel qui a été structuré pour un fonctionnement temps-réel et<br />multicanal sur le système HARMO.