Caractérisation de l'environnement musical dans les documents audiovisuels

Actuellement, la quantité de musique disponible, notamment via Internet, va tous les jours croissant. Les collections sont trop gigantesques pour qu'il soit possible d'y naviguer ou d'y rechercher un extrait sans l'aide d'outils informatiques. Notre travail se place dans le...

Full description

Bibliographic Details
Main Author: Lachambre, Hélène
Language:FRE
Published: Université Paul Sabatier - Toulouse III 2009
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00457522
http://tel.archives-ouvertes.fr/docs/00/45/75/22/PDF/These_Helene_Lachambre.pdf
http://tel.archives-ouvertes.fr/docs/00/45/75/22/ANNEX/Presentation_These_Helene_Lachambre.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00457522
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-004575222013-01-07T18:10:57Z http://tel.archives-ouvertes.fr/tel-00457522 http://tel.archives-ouvertes.fr/docs/00/45/75/22/PDF/These_Helene_Lachambre.pdf http://tel.archives-ouvertes.fr/docs/00/45/75/22/ANNEX/Presentation_These_Helene_Lachambre.pdf Caractérisation de l'environnement musical dans les documents audiovisuels Lachambre, Hélène [INFO] Computer Science Musique Indexation Monophonie Polyphonie Chant Loi de Weibull bivariée Vibrato étendu Vibrato Actuellement, la quantité de musique disponible, notamment via Internet, va tous les jours croissant. Les collections sont trop gigantesques pour qu'il soit possible d'y naviguer ou d'y rechercher un extrait sans l'aide d'outils informatiques. Notre travail se place dans le cadre général de l'indexation automatique de la musique. Afin de situer le contexte de travail, nous proposons tout d'abord une brève revue des travaux réalisés actuellement pour la description automatique de la musique à des fins d'indexation : reconnaissance d'instruments, détermination de la tonalité, du tempo, classification en genre et en émotion, identification du chanteur, transcriptions de la mélodie, de la partition, de la suite d'accords et des paroles. Pour chacun de ces sujets, nous nous attachons à définir le problème, les termes techniques propres au domaine, et nous nous attardons plus particulièrement sur les problèmes les plus saillants. Dans une seconde partie, nous décrivons le premier outil que nous avons développé : une distinction automatique entre les sons monophoniques et les sons polyphoniques. Nous avons proposé deux nouveaux paramètres, basés sur l'analyse d'un indice de confiance. La modélisation de la répartition bivariée de ces paramètre est réalisée par des distributions de Weibull bivariées. Le problème de l'estimation des paramètres de cette distribution nous a conduit à proposer une méthode originale d'estimation dérivée de l'analyse des moments de la loi. Une série d'expériences nous permet de comparer notre système à des approches classiques, et de valider toutes les étapes de notre méthode. Dans la troisième partie, nous proposons une méthode de détection du chant, accompagné ou non. Cette méthode se base sur la détection du vibrato, un paramètre défini à partir de l'analyse de la fréquence fondamentale, et défini a priori pour les sons monophoniques. A l'aide de deux segmentations, nous étendons ce concept aux sons polyphoniques, en introduisant un nouveau paramètre : le vibrato étendu. Les performances de cette méthode sont comparables à celles de l'état de l'art. La prise en compte du pré-traitement monophonique / polyphonique nous a amenés à adapter notre méthode de détection du chant à chacun de ces contextes. Les résultats s'en trouvent améliorés. Après une réflexion sur l'utilisation de la musique pour la description, l'annotation et l'indexation automatique des documents audiovisuels, nous nous posons la question de l'apport de chacun des outils décrits dans cette thèse au problème de l'indexation de la musique, et de l'indexation des documents audiovisuels par la musique et offrons quelques perspectives. 2009-12-08 FRE PhD thesis Université Paul Sabatier - Toulouse III
collection NDLTD
language FRE
sources NDLTD
topic [INFO] Computer Science
Musique
Indexation
Monophonie
Polyphonie
Chant
Loi de Weibull bivariée
Vibrato étendu
Vibrato
spellingShingle [INFO] Computer Science
Musique
Indexation
Monophonie
Polyphonie
Chant
Loi de Weibull bivariée
Vibrato étendu
Vibrato
Lachambre, Hélène
Caractérisation de l'environnement musical dans les documents audiovisuels
description Actuellement, la quantité de musique disponible, notamment via Internet, va tous les jours croissant. Les collections sont trop gigantesques pour qu'il soit possible d'y naviguer ou d'y rechercher un extrait sans l'aide d'outils informatiques. Notre travail se place dans le cadre général de l'indexation automatique de la musique. Afin de situer le contexte de travail, nous proposons tout d'abord une brève revue des travaux réalisés actuellement pour la description automatique de la musique à des fins d'indexation : reconnaissance d'instruments, détermination de la tonalité, du tempo, classification en genre et en émotion, identification du chanteur, transcriptions de la mélodie, de la partition, de la suite d'accords et des paroles. Pour chacun de ces sujets, nous nous attachons à définir le problème, les termes techniques propres au domaine, et nous nous attardons plus particulièrement sur les problèmes les plus saillants. Dans une seconde partie, nous décrivons le premier outil que nous avons développé : une distinction automatique entre les sons monophoniques et les sons polyphoniques. Nous avons proposé deux nouveaux paramètres, basés sur l'analyse d'un indice de confiance. La modélisation de la répartition bivariée de ces paramètre est réalisée par des distributions de Weibull bivariées. Le problème de l'estimation des paramètres de cette distribution nous a conduit à proposer une méthode originale d'estimation dérivée de l'analyse des moments de la loi. Une série d'expériences nous permet de comparer notre système à des approches classiques, et de valider toutes les étapes de notre méthode. Dans la troisième partie, nous proposons une méthode de détection du chant, accompagné ou non. Cette méthode se base sur la détection du vibrato, un paramètre défini à partir de l'analyse de la fréquence fondamentale, et défini a priori pour les sons monophoniques. A l'aide de deux segmentations, nous étendons ce concept aux sons polyphoniques, en introduisant un nouveau paramètre : le vibrato étendu. Les performances de cette méthode sont comparables à celles de l'état de l'art. La prise en compte du pré-traitement monophonique / polyphonique nous a amenés à adapter notre méthode de détection du chant à chacun de ces contextes. Les résultats s'en trouvent améliorés. Après une réflexion sur l'utilisation de la musique pour la description, l'annotation et l'indexation automatique des documents audiovisuels, nous nous posons la question de l'apport de chacun des outils décrits dans cette thèse au problème de l'indexation de la musique, et de l'indexation des documents audiovisuels par la musique et offrons quelques perspectives.
author Lachambre, Hélène
author_facet Lachambre, Hélène
author_sort Lachambre, Hélène
title Caractérisation de l'environnement musical dans les documents audiovisuels
title_short Caractérisation de l'environnement musical dans les documents audiovisuels
title_full Caractérisation de l'environnement musical dans les documents audiovisuels
title_fullStr Caractérisation de l'environnement musical dans les documents audiovisuels
title_full_unstemmed Caractérisation de l'environnement musical dans les documents audiovisuels
title_sort caractérisation de l'environnement musical dans les documents audiovisuels
publisher Université Paul Sabatier - Toulouse III
publishDate 2009
url http://tel.archives-ouvertes.fr/tel-00457522
http://tel.archives-ouvertes.fr/docs/00/45/75/22/PDF/These_Helene_Lachambre.pdf
http://tel.archives-ouvertes.fr/docs/00/45/75/22/ANNEX/Presentation_These_Helene_Lachambre.pdf
work_keys_str_mv AT lachambrehelene caracterisationdelenvironnementmusicaldanslesdocumentsaudiovisuels
_version_ 1716451259992506368