Extending the phase vocoder with damped sinusoid atomic decomposition of transients

Pitch-preserving time scale modification and time-preserving pitch modification of recorded sounds are integral effects in modern digital music production, and some implementation of these effects can be found in nearly all commercial digital audio production software. Recent research has led to imp...

Full description

Bibliographic Details
Main Author: Donaldson, Nicholas
Other Authors: Philippe Depalle (Internal/Supervisor)
Format: Others
Language:en
Published: McGill University 2011
Subjects:
Online Access:http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=104832
id ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.104832
record_format oai_dc
spelling ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.1048322014-02-13T03:56:27ZExtending the phase vocoder with damped sinusoid atomic decomposition of transientsDonaldson, NicholasEngineering - Electronics and ElectricalPitch-preserving time scale modification and time-preserving pitch modification of recorded sounds are integral effects in modern digital music production, and some implementation of these effects can be found in nearly all commercial digital audio production software. Recent research has led to improvements in the reduction of transient smearing artifacts in otherwise high-quality frequency domain time scaling (phase vocoder) algorithms, but many modern implementations still exhibit noticeable smoothing of very abrupt transients, especially for drastic time scale modifications. By using a sparse atomic decomposition method to create representations of the transients in an audio signal, the transient and steady-state content of the signal can be separated and processed separately. The phase vocoder can be used to modify only the steady-state content of the signal, preserving the fidelity of transients when using time scaling effects. Such an extension is introduced here, along with a working software implementation, which performs such feature-specific processing through the use of a damped sinusoid matching pursuit algorithm to represent and remove transients from an audio signal. A high-resolution transient onset detection algorithm is also presented, as well as a practical application of phase locking to a computationally efficient phase vocoder formulation.Modifier indépendamment la hauteur et l'échelle temporelle d'enregistrements sonores est devenu un outil essentiel de la production audio numérique actuelle; si bien que la plupart des logiciels commerciaux dédiés à la production incluent une version de ces effets. Les algorithmes d'étirement du sons fondés sur le vocodeur de phase permettent d'obtenir des résultats de très bonne qualité, notamment à la suite de travaux récents visant à réduire l'"étalement" des transitoires, artefacts caractéristiques de ces méthodes. Cependant, même les algorithmes les plus récents étalent les transitoires très abruptes, et ce d'autant plus que les modifications de l'échelle temporelle sont extrêmes. Afin de proposer une solution à ce problème, nous faisons ici appel à une décomposition atomique parcimonieuse permettant de dissocier les variations brusques du signal de ses variations plus lentes. Ceci permet alors de laisser les transitoires intacts et de ne modifier que le reste du son à l'aide d'un algorithme de type vocodeur de phase. Ceci assure ainsi une meilleure qualité de l'étirement temporel, même dans les cas extrêmes. Nous présentons dans ce mémoire les détails d'une telle méthode ainsi qu'un logiciel utilisant un algorithme de type "matching pursuit" pour représenter les transitoires du signal audio par des sinusoïdes amorties exponentiellement. Les autres contributions originales de ce travail incluent une nouvelle méthode de détection d'attaque à haute-résolution temporelle, ainsi que l'implémentation d'une version du vocodeur de phase peu coûteuse en temps de calcul et particulièrement appropriée à l'étirement des sons.McGill UniversityPhilippe Depalle (Internal/Supervisor)2011Electronic Thesis or Dissertationapplication/pdfenElectronically-submitted theses.All items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.Master of Arts (Schulich School of Music) http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=104832
collection NDLTD
language en
format Others
sources NDLTD
topic Engineering - Electronics and Electrical
spellingShingle Engineering - Electronics and Electrical
Donaldson, Nicholas
Extending the phase vocoder with damped sinusoid atomic decomposition of transients
description Pitch-preserving time scale modification and time-preserving pitch modification of recorded sounds are integral effects in modern digital music production, and some implementation of these effects can be found in nearly all commercial digital audio production software. Recent research has led to improvements in the reduction of transient smearing artifacts in otherwise high-quality frequency domain time scaling (phase vocoder) algorithms, but many modern implementations still exhibit noticeable smoothing of very abrupt transients, especially for drastic time scale modifications. By using a sparse atomic decomposition method to create representations of the transients in an audio signal, the transient and steady-state content of the signal can be separated and processed separately. The phase vocoder can be used to modify only the steady-state content of the signal, preserving the fidelity of transients when using time scaling effects. Such an extension is introduced here, along with a working software implementation, which performs such feature-specific processing through the use of a damped sinusoid matching pursuit algorithm to represent and remove transients from an audio signal. A high-resolution transient onset detection algorithm is also presented, as well as a practical application of phase locking to a computationally efficient phase vocoder formulation. === Modifier indépendamment la hauteur et l'échelle temporelle d'enregistrements sonores est devenu un outil essentiel de la production audio numérique actuelle; si bien que la plupart des logiciels commerciaux dédiés à la production incluent une version de ces effets. Les algorithmes d'étirement du sons fondés sur le vocodeur de phase permettent d'obtenir des résultats de très bonne qualité, notamment à la suite de travaux récents visant à réduire l'"étalement" des transitoires, artefacts caractéristiques de ces méthodes. Cependant, même les algorithmes les plus récents étalent les transitoires très abruptes, et ce d'autant plus que les modifications de l'échelle temporelle sont extrêmes. Afin de proposer une solution à ce problème, nous faisons ici appel à une décomposition atomique parcimonieuse permettant de dissocier les variations brusques du signal de ses variations plus lentes. Ceci permet alors de laisser les transitoires intacts et de ne modifier que le reste du son à l'aide d'un algorithme de type vocodeur de phase. Ceci assure ainsi une meilleure qualité de l'étirement temporel, même dans les cas extrêmes. Nous présentons dans ce mémoire les détails d'une telle méthode ainsi qu'un logiciel utilisant un algorithme de type "matching pursuit" pour représenter les transitoires du signal audio par des sinusoïdes amorties exponentiellement. Les autres contributions originales de ce travail incluent une nouvelle méthode de détection d'attaque à haute-résolution temporelle, ainsi que l'implémentation d'une version du vocodeur de phase peu coûteuse en temps de calcul et particulièrement appropriée à l'étirement des sons.
author2 Philippe Depalle (Internal/Supervisor)
author_facet Philippe Depalle (Internal/Supervisor)
Donaldson, Nicholas
author Donaldson, Nicholas
author_sort Donaldson, Nicholas
title Extending the phase vocoder with damped sinusoid atomic decomposition of transients
title_short Extending the phase vocoder with damped sinusoid atomic decomposition of transients
title_full Extending the phase vocoder with damped sinusoid atomic decomposition of transients
title_fullStr Extending the phase vocoder with damped sinusoid atomic decomposition of transients
title_full_unstemmed Extending the phase vocoder with damped sinusoid atomic decomposition of transients
title_sort extending the phase vocoder with damped sinusoid atomic decomposition of transients
publisher McGill University
publishDate 2011
url http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=104832
work_keys_str_mv AT donaldsonnicholas extendingthephasevocoderwithdampedsinusoidatomicdecompositionoftransients
_version_ 1716641560393678848