Extending the phase vocoder with damped sinusoid atomic decomposition of transients
Pitch-preserving time scale modification and time-preserving pitch modification of recorded sounds are integral effects in modern digital music production, and some implementation of these effects can be found in nearly all commercial digital audio production software. Recent research has led to imp...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | en |
Published: |
McGill University
2011
|
Subjects: | |
Online Access: | http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=104832 |
id |
ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.104832 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.1048322014-02-13T03:56:27ZExtending the phase vocoder with damped sinusoid atomic decomposition of transientsDonaldson, NicholasEngineering - Electronics and ElectricalPitch-preserving time scale modification and time-preserving pitch modification of recorded sounds are integral effects in modern digital music production, and some implementation of these effects can be found in nearly all commercial digital audio production software. Recent research has led to improvements in the reduction of transient smearing artifacts in otherwise high-quality frequency domain time scaling (phase vocoder) algorithms, but many modern implementations still exhibit noticeable smoothing of very abrupt transients, especially for drastic time scale modifications. By using a sparse atomic decomposition method to create representations of the transients in an audio signal, the transient and steady-state content of the signal can be separated and processed separately. The phase vocoder can be used to modify only the steady-state content of the signal, preserving the fidelity of transients when using time scaling effects. Such an extension is introduced here, along with a working software implementation, which performs such feature-specific processing through the use of a damped sinusoid matching pursuit algorithm to represent and remove transients from an audio signal. A high-resolution transient onset detection algorithm is also presented, as well as a practical application of phase locking to a computationally efficient phase vocoder formulation.Modifier indépendamment la hauteur et l'échelle temporelle d'enregistrements sonores est devenu un outil essentiel de la production audio numérique actuelle; si bien que la plupart des logiciels commerciaux dédiés à la production incluent une version de ces effets. Les algorithmes d'étirement du sons fondés sur le vocodeur de phase permettent d'obtenir des résultats de très bonne qualité, notamment à la suite de travaux récents visant à réduire l'"étalement" des transitoires, artefacts caractéristiques de ces méthodes. Cependant, même les algorithmes les plus récents étalent les transitoires très abruptes, et ce d'autant plus que les modifications de l'échelle temporelle sont extrêmes. Afin de proposer une solution à ce problème, nous faisons ici appel à une décomposition atomique parcimonieuse permettant de dissocier les variations brusques du signal de ses variations plus lentes. Ceci permet alors de laisser les transitoires intacts et de ne modifier que le reste du son à l'aide d'un algorithme de type vocodeur de phase. Ceci assure ainsi une meilleure qualité de l'étirement temporel, même dans les cas extrêmes. Nous présentons dans ce mémoire les détails d'une telle méthode ainsi qu'un logiciel utilisant un algorithme de type "matching pursuit" pour représenter les transitoires du signal audio par des sinusoïdes amorties exponentiellement. Les autres contributions originales de ce travail incluent une nouvelle méthode de détection d'attaque à haute-résolution temporelle, ainsi que l'implémentation d'une version du vocodeur de phase peu coûteuse en temps de calcul et particulièrement appropriée à l'étirement des sons.McGill UniversityPhilippe Depalle (Internal/Supervisor)2011Electronic Thesis or Dissertationapplication/pdfenElectronically-submitted theses.All items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.Master of Arts (Schulich School of Music) http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=104832 |
collection |
NDLTD |
language |
en |
format |
Others
|
sources |
NDLTD |
topic |
Engineering - Electronics and Electrical |
spellingShingle |
Engineering - Electronics and Electrical Donaldson, Nicholas Extending the phase vocoder with damped sinusoid atomic decomposition of transients |
description |
Pitch-preserving time scale modification and time-preserving pitch modification of recorded sounds are integral effects in modern digital music production, and some implementation of these effects can be found in nearly all commercial digital audio production software. Recent research has led to improvements in the reduction of transient smearing artifacts in otherwise high-quality frequency domain time scaling (phase vocoder) algorithms, but many modern implementations still exhibit noticeable smoothing of very abrupt transients, especially for drastic time scale modifications. By using a sparse atomic decomposition method to create representations of the transients in an audio signal, the transient and steady-state content of the signal can be separated and processed separately. The phase vocoder can be used to modify only the steady-state content of the signal, preserving the fidelity of transients when using time scaling effects. Such an extension is introduced here, along with a working software implementation, which performs such feature-specific processing through the use of a damped sinusoid matching pursuit algorithm to represent and remove transients from an audio signal. A high-resolution transient onset detection algorithm is also presented, as well as a practical application of phase locking to a computationally efficient phase vocoder formulation. === Modifier indépendamment la hauteur et l'échelle temporelle d'enregistrements sonores est devenu un outil essentiel de la production audio numérique actuelle; si bien que la plupart des logiciels commerciaux dédiés à la production incluent une version de ces effets. Les algorithmes d'étirement du sons fondés sur le vocodeur de phase permettent d'obtenir des résultats de très bonne qualité, notamment à la suite de travaux récents visant à réduire l'"étalement" des transitoires, artefacts caractéristiques de ces méthodes. Cependant, même les algorithmes les plus récents étalent les transitoires très abruptes, et ce d'autant plus que les modifications de l'échelle temporelle sont extrêmes. Afin de proposer une solution à ce problème, nous faisons ici appel à une décomposition atomique parcimonieuse permettant de dissocier les variations brusques du signal de ses variations plus lentes. Ceci permet alors de laisser les transitoires intacts et de ne modifier que le reste du son à l'aide d'un algorithme de type vocodeur de phase. Ceci assure ainsi une meilleure qualité de l'étirement temporel, même dans les cas extrêmes. Nous présentons dans ce mémoire les détails d'une telle méthode ainsi qu'un logiciel utilisant un algorithme de type "matching pursuit" pour représenter les transitoires du signal audio par des sinusoïdes amorties exponentiellement. Les autres contributions originales de ce travail incluent une nouvelle méthode de détection d'attaque à haute-résolution temporelle, ainsi que l'implémentation d'une version du vocodeur de phase peu coûteuse en temps de calcul et particulièrement appropriée à l'étirement des sons. |
author2 |
Philippe Depalle (Internal/Supervisor) |
author_facet |
Philippe Depalle (Internal/Supervisor) Donaldson, Nicholas |
author |
Donaldson, Nicholas |
author_sort |
Donaldson, Nicholas |
title |
Extending the phase vocoder with damped sinusoid atomic decomposition of transients |
title_short |
Extending the phase vocoder with damped sinusoid atomic decomposition of transients |
title_full |
Extending the phase vocoder with damped sinusoid atomic decomposition of transients |
title_fullStr |
Extending the phase vocoder with damped sinusoid atomic decomposition of transients |
title_full_unstemmed |
Extending the phase vocoder with damped sinusoid atomic decomposition of transients |
title_sort |
extending the phase vocoder with damped sinusoid atomic decomposition of transients |
publisher |
McGill University |
publishDate |
2011 |
url |
http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=104832 |
work_keys_str_mv |
AT donaldsonnicholas extendingthephasevocoderwithdampedsinusoidatomicdecompositionoftransients |
_version_ |
1716641560393678848 |