On temporal coherency of probabilistic models for audio-to-score alignment
Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est...
Main Author: | |
---|---|
Other Authors: | |
Language: | en |
Published: |
2016
|
Subjects: | |
Online Access: | http://www.theses.fr/2016PA066532/document |
id |
ndltd-theses.fr-2016PA066532 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-theses.fr-2016PA0665322019-12-22T04:45:25Z On temporal coherency of probabilistic models for audio-to-score alignment Modèles probabilistes temporellement cohérents pour l'alignement audio-sur-partition Traitement du signal Alignement musique sur partition Inférence Modèles de semi-Markov cachés Processus de Lévy Totale positivité d'ordre 2 Music to score alignment Lévy processes Hidden semi-Markov models 004.3 Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est de modéliser l'évolution temporelle des événements par des processus stochastiques. Notre démarche part d'une spécificité de l'alignement musical : une partition attribue à chaque événement une durée nominale, qui est une information a priori sur la durée probable d'occurrence de l'événement. La problématique qui nous occupe est celle de la modélisation probabiliste de cette information de durée. Nous définissons la notion de cohérence temporelle à travers plusieurs critères de cohérence que devrait respecter tout algorithme d'alignement musical. Ensuite, nous menons une démarche axiomatique autour du cas des modèles de semi-Markov cachés. Nous démontrons que ces critères sont respectés lorsque des conditions mathématiques particulières sont vérifiées par les lois a priori du modèle probabiliste de la partition. Ces conditions proviennent de deux domaines mathématiques jusqu'ici étrangers à la question de l'alignement : les processus de Lévy et la totale positivité d'ordre deux. De nouveaux résultats théoriques sont démontrés sur l'interrelation entre ces deux notions. En outre, les bienfaits pratiques de ces résultats théoriques sont démontrés expérimentalement sur des algorithmes d'alignement en temps réel. This thesis deals with automatic alignment of audio recordings with corresponding music scores. We study algorithmic solutions for this problem in the framework of probabilistic models which represent hidden evolution on the music score as stochastic process. We begin this work by investigating theoretical foundations of the design of such models. To do so, we undertake an axiomatic approach which is based on an application peculiarity: music scores provide nominal duration for each event, which is a hint for the actual and unknown duration. Thus, modeling this specific temporal structure through stochastic processes is our main problematic. We define temporal coherency as compliance with such prior information and refine this abstract notion by stating two criteria of coherency. Focusing on hidden semi-Markov models, we demonstrate that coherency is guaranteed by specific mathematical conditions on the probabilistic design and that fulfilling these prescriptions significantly improves precision of alignment algorithms. Such conditions are derived by combining two fields of mathematics, Lévy processes and total positivity of order 2. This is why the second part of this work is a theoretical investigation which extends existing results in the related literature. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016PA066532/document Cuvillier, Philippe 2016-12-15 Paris 6 Cont, Arshia |
collection |
NDLTD |
language |
en |
sources |
NDLTD |
topic |
Traitement du signal Alignement musique sur partition Inférence Modèles de semi-Markov cachés Processus de Lévy Totale positivité d'ordre 2 Music to score alignment Lévy processes Hidden semi-Markov models 004.3 |
spellingShingle |
Traitement du signal Alignement musique sur partition Inférence Modèles de semi-Markov cachés Processus de Lévy Totale positivité d'ordre 2 Music to score alignment Lévy processes Hidden semi-Markov models 004.3 Cuvillier, Philippe On temporal coherency of probabilistic models for audio-to-score alignment |
description |
Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est de modéliser l'évolution temporelle des événements par des processus stochastiques. Notre démarche part d'une spécificité de l'alignement musical : une partition attribue à chaque événement une durée nominale, qui est une information a priori sur la durée probable d'occurrence de l'événement. La problématique qui nous occupe est celle de la modélisation probabiliste de cette information de durée. Nous définissons la notion de cohérence temporelle à travers plusieurs critères de cohérence que devrait respecter tout algorithme d'alignement musical. Ensuite, nous menons une démarche axiomatique autour du cas des modèles de semi-Markov cachés. Nous démontrons que ces critères sont respectés lorsque des conditions mathématiques particulières sont vérifiées par les lois a priori du modèle probabiliste de la partition. Ces conditions proviennent de deux domaines mathématiques jusqu'ici étrangers à la question de l'alignement : les processus de Lévy et la totale positivité d'ordre deux. De nouveaux résultats théoriques sont démontrés sur l'interrelation entre ces deux notions. En outre, les bienfaits pratiques de ces résultats théoriques sont démontrés expérimentalement sur des algorithmes d'alignement en temps réel. === This thesis deals with automatic alignment of audio recordings with corresponding music scores. We study algorithmic solutions for this problem in the framework of probabilistic models which represent hidden evolution on the music score as stochastic process. We begin this work by investigating theoretical foundations of the design of such models. To do so, we undertake an axiomatic approach which is based on an application peculiarity: music scores provide nominal duration for each event, which is a hint for the actual and unknown duration. Thus, modeling this specific temporal structure through stochastic processes is our main problematic. We define temporal coherency as compliance with such prior information and refine this abstract notion by stating two criteria of coherency. Focusing on hidden semi-Markov models, we demonstrate that coherency is guaranteed by specific mathematical conditions on the probabilistic design and that fulfilling these prescriptions significantly improves precision of alignment algorithms. Such conditions are derived by combining two fields of mathematics, Lévy processes and total positivity of order 2. This is why the second part of this work is a theoretical investigation which extends existing results in the related literature. |
author2 |
Paris 6 |
author_facet |
Paris 6 Cuvillier, Philippe |
author |
Cuvillier, Philippe |
author_sort |
Cuvillier, Philippe |
title |
On temporal coherency of probabilistic models for audio-to-score alignment |
title_short |
On temporal coherency of probabilistic models for audio-to-score alignment |
title_full |
On temporal coherency of probabilistic models for audio-to-score alignment |
title_fullStr |
On temporal coherency of probabilistic models for audio-to-score alignment |
title_full_unstemmed |
On temporal coherency of probabilistic models for audio-to-score alignment |
title_sort |
on temporal coherency of probabilistic models for audio-to-score alignment |
publishDate |
2016 |
url |
http://www.theses.fr/2016PA066532/document |
work_keys_str_mv |
AT cuvillierphilippe ontemporalcoherencyofprobabilisticmodelsforaudiotoscorealignment AT cuvillierphilippe modelesprobabilistestemporellementcoherentspourlalignementaudiosurpartition |
_version_ |
1719305613085769728 |