Pitch-shifting algorithm design and applications in music
Pitch-shifting lowers or increases the pitch of an audio recording. This technique hasbeen used in recording studios since the 1960s, many Beatles tracks being producedusing analog pitch-shifting effects. With the advent of the first digital pitch-shiftinghardware in the 1970s, this technique became...
Main Author: | |
---|---|
Format: | Others |
Language: | English |
Published: |
KTH, Skolan för elektroteknik och datavetenskap (EECS)
2019
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-266118 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-266118 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-2661182019-12-21T03:45:46ZPitch-shifting algorithm design and applications in musicengRoyer, TheoKTH, Skolan för elektroteknik och datavetenskap (EECS)2019Engineering and TechnologyTeknik och teknologierPitch-shifting lowers or increases the pitch of an audio recording. This technique hasbeen used in recording studios since the 1960s, many Beatles tracks being producedusing analog pitch-shifting effects. With the advent of the first digital pitch-shiftinghardware in the 1970s, this technique became essential in music production. Nowadays,it is massively used in popular music for pitch correction or other creative purposes.With the improvement of mixing and mastering processes, the recent focusin the audio industry has been placed on the high quality of pitch-shifting tools. Asa consequence, current state-of-the-art literature algorithms are often outperformedby the best commercial algorithms. Unfortunately, these commercial algorithms are”black boxes” which are very complicated to reverse engineer.In this master thesis, state-of-the-art pitch-shifting techniques found in the literatureare evaluated, attaching great importance to audio quality on musical signals.Time domain and frequency domain methods are studied and tested on a wide rangeof audio signals. Two offline implementations of the most promising algorithms areproposed with novel features. Pitch Synchronous Overlap and Add (PSOLA), a simpletime domain algorithm, is used to create pitch-shifting, formant-shifting, pitchcorrection and chorus effects on voice and monophonic signals. Phase vocoder, amore complex frequency domain algorithm, is combined with high quality spectralenvelope estimation and harmonic-percussive separation to design a polyvalentpitch-shifting and formant-shifting algorithm. Subjective evaluations indicate thatthe resulting quality is comparable to that of the commercial algorithms. Pitch-shifting sänker eller ökar tonhöjden för en ljudinspelning. Denna teknik har använts i inspelningsstudior sedan 1960-talet, många Beatles-spår produceras med hjälp av analoga pitch-shifting effekter. Med ankomsten av den första digitala pitchshifting hårdvaran på 1970-talet blev denna teknik avgörande för musikproduktionen. Numera används det massivt i populärmusik för pitchkorrigering eller andra kreativa ändamål. Med förbättringen av blandningsoch masteringsprocesser har det senaste fokuset inom ljudindustrin placerats på högkvalitativa pitch-shiftingverktyg. Till följd av detta är nuvarande toppmoderna litteraturalgoritmer ofta överträffade av de bästa kommersiella algoritmerna. Tyvärr är dessa kommersiella algoritmer svarta lådor som är väldigt komplicerade att vända sig om.I den här mastersuppsatsen utvärderas toppmoderna pitch-shifting-tekniker som finns i litteraturen och lägger stor vikt vid ljudkvaliteten på musikaliska signaler. Tiddomäner och frekvensdomänmetoder studeras och testas på ett brett spektrum av ljudsignaler. Två offline-implementeringar av de mest lovande algoritmerna föreslås med nya funktioner. Pitch Synchronous Overlap and Add (PSOLA), en enkel tidsdomänalgoritm, används för att skapa pitch-shifting, formant-shifting, pitch-korrigeringoch kör-effekt på röstoch monofoniska signaler. Fas vocoder, en mer komplexfrekvensdomänalgoritm, kombineras med högkvalitativt spektralhöljeuppskattning och harmonisk-perkussiv separation för att designa en flervärd pitch-shifting och formant-shifting algoritm. Subjektiva utvärderingar indikerar att den resulterandekvaliteten är jämförbar med den av kommersiella algoritmerna. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-266118TRITA-EECS-EX ; 2019:674application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
English |
format |
Others
|
sources |
NDLTD |
topic |
Engineering and Technology Teknik och teknologier |
spellingShingle |
Engineering and Technology Teknik och teknologier Royer, Theo Pitch-shifting algorithm design and applications in music |
description |
Pitch-shifting lowers or increases the pitch of an audio recording. This technique hasbeen used in recording studios since the 1960s, many Beatles tracks being producedusing analog pitch-shifting effects. With the advent of the first digital pitch-shiftinghardware in the 1970s, this technique became essential in music production. Nowadays,it is massively used in popular music for pitch correction or other creative purposes.With the improvement of mixing and mastering processes, the recent focusin the audio industry has been placed on the high quality of pitch-shifting tools. Asa consequence, current state-of-the-art literature algorithms are often outperformedby the best commercial algorithms. Unfortunately, these commercial algorithms are”black boxes” which are very complicated to reverse engineer.In this master thesis, state-of-the-art pitch-shifting techniques found in the literatureare evaluated, attaching great importance to audio quality on musical signals.Time domain and frequency domain methods are studied and tested on a wide rangeof audio signals. Two offline implementations of the most promising algorithms areproposed with novel features. Pitch Synchronous Overlap and Add (PSOLA), a simpletime domain algorithm, is used to create pitch-shifting, formant-shifting, pitchcorrection and chorus effects on voice and monophonic signals. Phase vocoder, amore complex frequency domain algorithm, is combined with high quality spectralenvelope estimation and harmonic-percussive separation to design a polyvalentpitch-shifting and formant-shifting algorithm. Subjective evaluations indicate thatthe resulting quality is comparable to that of the commercial algorithms. === Pitch-shifting sänker eller ökar tonhöjden för en ljudinspelning. Denna teknik har använts i inspelningsstudior sedan 1960-talet, många Beatles-spår produceras med hjälp av analoga pitch-shifting effekter. Med ankomsten av den första digitala pitchshifting hårdvaran på 1970-talet blev denna teknik avgörande för musikproduktionen. Numera används det massivt i populärmusik för pitchkorrigering eller andra kreativa ändamål. Med förbättringen av blandningsoch masteringsprocesser har det senaste fokuset inom ljudindustrin placerats på högkvalitativa pitch-shiftingverktyg. Till följd av detta är nuvarande toppmoderna litteraturalgoritmer ofta överträffade av de bästa kommersiella algoritmerna. Tyvärr är dessa kommersiella algoritmer svarta lådor som är väldigt komplicerade att vända sig om.I den här mastersuppsatsen utvärderas toppmoderna pitch-shifting-tekniker som finns i litteraturen och lägger stor vikt vid ljudkvaliteten på musikaliska signaler. Tiddomäner och frekvensdomänmetoder studeras och testas på ett brett spektrum av ljudsignaler. Två offline-implementeringar av de mest lovande algoritmerna föreslås med nya funktioner. Pitch Synchronous Overlap and Add (PSOLA), en enkel tidsdomänalgoritm, används för att skapa pitch-shifting, formant-shifting, pitch-korrigeringoch kör-effekt på röstoch monofoniska signaler. Fas vocoder, en mer komplexfrekvensdomänalgoritm, kombineras med högkvalitativt spektralhöljeuppskattning och harmonisk-perkussiv separation för att designa en flervärd pitch-shifting och formant-shifting algoritm. Subjektiva utvärderingar indikerar att den resulterandekvaliteten är jämförbar med den av kommersiella algoritmerna. |
author |
Royer, Theo |
author_facet |
Royer, Theo |
author_sort |
Royer, Theo |
title |
Pitch-shifting algorithm design and applications in music |
title_short |
Pitch-shifting algorithm design and applications in music |
title_full |
Pitch-shifting algorithm design and applications in music |
title_fullStr |
Pitch-shifting algorithm design and applications in music |
title_full_unstemmed |
Pitch-shifting algorithm design and applications in music |
title_sort |
pitch-shifting algorithm design and applications in music |
publisher |
KTH, Skolan för elektroteknik och datavetenskap (EECS) |
publishDate |
2019 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-266118 |
work_keys_str_mv |
AT royertheo pitchshiftingalgorithmdesignandapplicationsinmusic |
_version_ |
1719304403966492672 |