Caractérisation de l'environnement musical dans les documents audiovisuels

Actuellement, la quantité de musique disponible, notamment via Internet, va tous les jours croissant. Les collections sont trop gigantesques pour qu'il soit possible d'y naviguer ou d'y rechercher un extrait sans l'aide d'outils informatiques. Notre travail se place dans le...

Full description

Bibliographic Details
Main Author:	Lachambre, Hélène
Language:	FRE
Published:	Université Paul Sabatier - Toulouse III 2009
Subjects:	[INFO] Computer Science Musique Indexation Monophonie Polyphonie Chant Loi de Weibull bivariée Vibrato étendu Vibrato
Online Access:	http://tel.archives-ouvertes.fr/tel-00457522 http://tel.archives-ouvertes.fr/docs/00/45/75/22/PDF/These_Helene_Lachambre.pdf http://tel.archives-ouvertes.fr/docs/00/45/75/22/ANNEX/Presentation_These_Helene_Lachambre.pdf

Description
Summary:	Actuellement, la quantité de musique disponible, notamment via Internet, va tous les jours croissant. Les collections sont trop gigantesques pour qu'il soit possible d'y naviguer ou d'y rechercher un extrait sans l'aide d'outils informatiques. Notre travail se place dans le cadre général de l'indexation automatique de la musique. Aﬁn de situer le contexte de travail, nous proposons tout d'abord une brève revue des travaux réalisés actuellement pour la description automatique de la musique à des ﬁns d'indexation : reconnaissance d'instruments, détermination de la tonalité, du tempo, classiﬁcation en genre et en émotion, identiﬁcation du chanteur, transcriptions de la mélodie, de la partition, de la suite d'accords et des paroles. Pour chacun de ces sujets, nous nous attachons à déﬁnir le problème, les termes techniques propres au domaine, et nous nous attardons plus particulièrement sur les problèmes les plus saillants. Dans une seconde partie, nous décrivons le premier outil que nous avons développé : une distinction automatique entre les sons monophoniques et les sons polyphoniques. Nous avons proposé deux nouveaux paramètres, basés sur l'analyse d'un indice de conﬁance. La modélisation de la répartition bivariée de ces paramètre est réalisée par des distributions de Weibull bivariées. Le problème de l'estimation des paramètres de cette distribution nous a conduit à proposer une méthode originale d'estimation dérivée de l'analyse des moments de la loi. Une série d'expériences nous permet de comparer notre système à des approches classiques, et de valider toutes les étapes de notre méthode. Dans la troisième partie, nous proposons une méthode de détection du chant, accompagné ou non. Cette méthode se base sur la détection du vibrato, un paramètre déﬁni à partir de l'analyse de la fréquence fondamentale, et déﬁni a priori pour les sons monophoniques. A l'aide de deux segmentations, nous étendons ce concept aux sons polyphoniques, en introduisant un nouveau paramètre : le vibrato étendu. Les performances de cette méthode sont comparables à celles de l'état de l'art. La prise en compte du pré-traitement monophonique / polyphonique nous a amenés à adapter notre méthode de détection du chant à chacun de ces contextes. Les résultats s'en trouvent améliorés. Après une réﬂexion sur l'utilisation de la musique pour la description, l'annotation et l'indexation automatique des documents audiovisuels, nous nous posons la question de l'apport de chacun des outils décrits dans cette thèse au problème de l'indexation de la musique, et de l'indexation des documents audiovisuels par la musique et oﬀrons quelques perspectives.

Caractérisation de l'environnement musical dans les documents audiovisuels

Similar Items