On temporal coherency of probabilistic models for audio-to-score alignment

Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est...

Full description

Bibliographic Details
Main Author: Cuvillier, Philippe
Other Authors: Paris 6
Language:en
Published: 2016
Subjects:
Online Access:http://www.theses.fr/2016PA066532/document
id ndltd-theses.fr-2016PA066532
record_format oai_dc
spelling ndltd-theses.fr-2016PA0665322019-12-22T04:45:25Z On temporal coherency of probabilistic models for audio-to-score alignment Modèles probabilistes temporellement cohérents pour l'alignement audio-sur-partition Traitement du signal Alignement musique sur partition Inférence Modèles de semi-Markov cachés Processus de Lévy Totale positivité d'ordre 2 Music to score alignment Lévy processes Hidden semi-Markov models 004.3 Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est de modéliser l'évolution temporelle des événements par des processus stochastiques. Notre démarche part d'une spécificité de l'alignement musical : une partition attribue à chaque événement une durée nominale, qui est une information a priori sur la durée probable d'occurrence de l'événement. La problématique qui nous occupe est celle de la modélisation probabiliste de cette information de durée. Nous définissons la notion de cohérence temporelle à travers plusieurs critères de cohérence que devrait respecter tout algorithme d'alignement musical. Ensuite, nous menons une démarche axiomatique autour du cas des modèles de semi-Markov cachés. Nous démontrons que ces critères sont respectés lorsque des conditions mathématiques particulières sont vérifiées par les lois a priori du modèle probabiliste de la partition. Ces conditions proviennent de deux domaines mathématiques jusqu'ici étrangers à la question de l'alignement : les processus de Lévy et la totale positivité d'ordre deux. De nouveaux résultats théoriques sont démontrés sur l'interrelation entre ces deux notions. En outre, les bienfaits pratiques de ces résultats théoriques sont démontrés expérimentalement sur des algorithmes d'alignement en temps réel. This thesis deals with automatic alignment of audio recordings with corresponding music scores. We study algorithmic solutions for this problem in the framework of probabilistic models which represent hidden evolution on the music score as stochastic process. We begin this work by investigating theoretical foundations of the design of such models. To do so, we undertake an axiomatic approach which is based on an application peculiarity: music scores provide nominal duration for each event, which is a hint for the actual and unknown duration. Thus, modeling this specific temporal structure through stochastic processes is our main problematic. We define temporal coherency as compliance with such prior information and refine this abstract notion by stating two criteria of coherency. Focusing on hidden semi-Markov models, we demonstrate that coherency is guaranteed by specific mathematical conditions on the probabilistic design and that fulfilling these prescriptions significantly improves precision of alignment algorithms. Such conditions are derived by combining two fields of mathematics, Lévy processes and total positivity of order 2. This is why the second part of this work is a theoretical investigation which extends existing results in the related literature. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016PA066532/document Cuvillier, Philippe 2016-12-15 Paris 6 Cont, Arshia
collection NDLTD
language en
sources NDLTD
topic Traitement du signal
Alignement musique sur partition
Inférence
Modèles de semi-Markov cachés
Processus de Lévy
Totale positivité d'ordre 2
Music to score alignment
Lévy processes
Hidden semi-Markov models
004.3
spellingShingle Traitement du signal
Alignement musique sur partition
Inférence
Modèles de semi-Markov cachés
Processus de Lévy
Totale positivité d'ordre 2
Music to score alignment
Lévy processes
Hidden semi-Markov models
004.3
Cuvillier, Philippe
On temporal coherency of probabilistic models for audio-to-score alignment
description Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est de modéliser l'évolution temporelle des événements par des processus stochastiques. Notre démarche part d'une spécificité de l'alignement musical : une partition attribue à chaque événement une durée nominale, qui est une information a priori sur la durée probable d'occurrence de l'événement. La problématique qui nous occupe est celle de la modélisation probabiliste de cette information de durée. Nous définissons la notion de cohérence temporelle à travers plusieurs critères de cohérence que devrait respecter tout algorithme d'alignement musical. Ensuite, nous menons une démarche axiomatique autour du cas des modèles de semi-Markov cachés. Nous démontrons que ces critères sont respectés lorsque des conditions mathématiques particulières sont vérifiées par les lois a priori du modèle probabiliste de la partition. Ces conditions proviennent de deux domaines mathématiques jusqu'ici étrangers à la question de l'alignement : les processus de Lévy et la totale positivité d'ordre deux. De nouveaux résultats théoriques sont démontrés sur l'interrelation entre ces deux notions. En outre, les bienfaits pratiques de ces résultats théoriques sont démontrés expérimentalement sur des algorithmes d'alignement en temps réel. === This thesis deals with automatic alignment of audio recordings with corresponding music scores. We study algorithmic solutions for this problem in the framework of probabilistic models which represent hidden evolution on the music score as stochastic process. We begin this work by investigating theoretical foundations of the design of such models. To do so, we undertake an axiomatic approach which is based on an application peculiarity: music scores provide nominal duration for each event, which is a hint for the actual and unknown duration. Thus, modeling this specific temporal structure through stochastic processes is our main problematic. We define temporal coherency as compliance with such prior information and refine this abstract notion by stating two criteria of coherency. Focusing on hidden semi-Markov models, we demonstrate that coherency is guaranteed by specific mathematical conditions on the probabilistic design and that fulfilling these prescriptions significantly improves precision of alignment algorithms. Such conditions are derived by combining two fields of mathematics, Lévy processes and total positivity of order 2. This is why the second part of this work is a theoretical investigation which extends existing results in the related literature.
author2 Paris 6
author_facet Paris 6
Cuvillier, Philippe
author Cuvillier, Philippe
author_sort Cuvillier, Philippe
title On temporal coherency of probabilistic models for audio-to-score alignment
title_short On temporal coherency of probabilistic models for audio-to-score alignment
title_full On temporal coherency of probabilistic models for audio-to-score alignment
title_fullStr On temporal coherency of probabilistic models for audio-to-score alignment
title_full_unstemmed On temporal coherency of probabilistic models for audio-to-score alignment
title_sort on temporal coherency of probabilistic models for audio-to-score alignment
publishDate 2016
url http://www.theses.fr/2016PA066532/document
work_keys_str_mv AT cuvillierphilippe ontemporalcoherencyofprobabilisticmodelsforaudiotoscorealignment
AT cuvillierphilippe modelesprobabilistestemporellementcoherentspourlalignementaudiosurpartition
_version_ 1719305613085769728