Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis
Additive synthesis models are popular for musical applications because they offer precise control over the temporal-spectral evolution of sound. The main difficulty in additive modelling lies in the estimation and tracking of model parameters for sounds with time-varying frequency content (this is...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | en |
Published: |
McGill University
2008
|
Subjects: | |
Online Access: | http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=21926 |
id |
ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.21926 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.219262014-02-13T03:56:53ZImproved hidden Markov model partial tracking for additive synthesis using time-frequency analysisKereliuk, CoreyEngineering - Electronics and ElectricalAdditive synthesis models are popular for musical applications because they offer precise control over the temporal-spectral evolution of sound. The main difficulty in additive modelling lies in the estimation and tracking of model parameters for sounds with time-varying frequency content (this is especially common in music). In the work presented here, a modification is proposed to the hidden Markov model developed by Depalle et al. which improves the estimation and tracking of partial frequencies for additive synthesis. The Wigner-Ville distribution is used in conjunction with the Hough transform in order to re-estimate the frequency and chirp rate from the short-term spectrum. These estimates are then used to formulate a new objective function to score state transitions in the hidden Markov model. The system performance is evaluated using a suite of real and synthetic test signals, and compared to state-of-the-art analysis tools. A clear improvement is demonstrated for highly non-stationary monophonic and polyphonic sounds. Additionally, crossing partials are detected to a limited extent, although further work is still needed to address this problem. This work identifies many strategies to improve additive modelling and suggests several directions for future research.Les modèles de synthèse additifs sont très prisés pour le traitement de sons musicaux car ils permettent un contrôle précis de l'évolution des propriétés spectrales et temporelles du signal sonore. La principale difficulté de ce type de modélisation provient de l'estimation et du suivi temporel des paramètres du modéle--en particulier pour les sons monophoniques à contenu spectral fortement variable ainsi que pour les sons polyphoniques (cas très courants en musique). Cette thèse s'attache à améliorer l'estimation et le suivi de partiels par modèle de Markov caché initialement proposé par Depalle et al.. La transformée de Wigner-Ville ainsi que la tranformée de Hough sont considérées de manière à ré-estimer la fréquence ainsi que sa derivée du premier ordre à partir du spectre à court-terme. Ces nouvelles estimations permettent de proposer une nouvelle fonction de score, utilisées dans la description des transitions entres états au sein du modèle de Markov caché. Des études de cas synthétiques et réels démontrent une amélioration des performances par rapport à des chaînes d'analyse répresentant l'état de l'art dans le domaine. L'amélioration la plus conséquente porte sur l'analyse de sons monophoniques hautement non-stationnaires et de sons polyphoniques. De plus, les croisements entre deux partiels sont jusqu'à un certain point detectés par le système. Quelques pistes prospectives sont proposées à la fin du document pour pallier ce difficile problème.McGill UniversityPhilippe Depalle (Internal/Supervisor)2008Electronic Thesis or Dissertationapplication/pdfenElectronically-submitted theses.All items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.Master of Arts (Schulich School of Music) http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=21926 |
collection |
NDLTD |
language |
en |
format |
Others
|
sources |
NDLTD |
topic |
Engineering - Electronics and Electrical |
spellingShingle |
Engineering - Electronics and Electrical Kereliuk, Corey Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis |
description |
Additive synthesis models are popular for musical applications because they offer precise control over the temporal-spectral evolution of sound. The main difficulty in additive modelling lies in the estimation and tracking of model parameters for sounds with time-varying frequency content (this is especially common in music). In the work presented here, a modification is proposed to the hidden Markov model developed by Depalle et al. which improves the estimation and tracking of partial frequencies for additive synthesis. The Wigner-Ville distribution is used in conjunction with the Hough transform in order to re-estimate the frequency and chirp rate from the short-term spectrum. These estimates are then used to formulate a new objective function to score state transitions in the hidden Markov model. The system performance is evaluated using a suite of real and synthetic test signals, and compared to state-of-the-art analysis tools. A clear improvement is demonstrated for highly non-stationary monophonic and polyphonic sounds. Additionally, crossing partials are detected to a limited extent, although further work is still needed to address this problem. This work identifies many strategies to improve additive modelling and suggests several directions for future research. === Les modèles de synthèse additifs sont très prisés pour le traitement de sons musicaux car ils permettent un contrôle précis de l'évolution des propriétés spectrales et temporelles du signal sonore. La principale difficulté de ce type de modélisation provient de l'estimation et du suivi temporel des paramètres du modéle--en particulier pour les sons monophoniques à contenu spectral fortement variable ainsi que pour les sons polyphoniques (cas très courants en musique). Cette thèse s'attache à améliorer l'estimation et le suivi de partiels par modèle de Markov caché initialement proposé par Depalle et al.. La transformée de Wigner-Ville ainsi que la tranformée de Hough sont considérées de manière à ré-estimer la fréquence ainsi que sa derivée du premier ordre à partir du spectre à court-terme. Ces nouvelles estimations permettent de proposer une nouvelle fonction de score, utilisées dans la description des transitions entres états au sein du modèle de Markov caché. Des études de cas synthétiques et réels démontrent une amélioration des performances par rapport à des chaînes d'analyse répresentant l'état de l'art dans le domaine. L'amélioration la plus conséquente porte sur l'analyse de sons monophoniques hautement non-stationnaires et de sons polyphoniques. De plus, les croisements entre deux partiels sont jusqu'à un certain point detectés par le système. Quelques pistes prospectives sont proposées à la fin du document pour pallier ce difficile problème. |
author2 |
Philippe Depalle (Internal/Supervisor) |
author_facet |
Philippe Depalle (Internal/Supervisor) Kereliuk, Corey |
author |
Kereliuk, Corey |
author_sort |
Kereliuk, Corey |
title |
Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis |
title_short |
Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis |
title_full |
Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis |
title_fullStr |
Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis |
title_full_unstemmed |
Improved hidden Markov model partial tracking for additive synthesis using time-frequency analysis |
title_sort |
improved hidden markov model partial tracking for additive synthesis using time-frequency analysis |
publisher |
McGill University |
publishDate |
2008 |
url |
http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=21926 |
work_keys_str_mv |
AT kereliukcorey improvedhiddenmarkovmodelpartialtrackingforadditivesynthesisusingtimefrequencyanalysis |
_version_ |
1716641989832736768 |