Summary: | Controlling what a neural network generates has had great success when applied in the image domain. This thesis explores the performance of similar methods but instead applied in music generation. WaveNET, a state of the art neural network in audio synthesis and generation is trained using Generative Adversarial Networks to produce piano music. Two different methods for controlling the generation are presented, named HARD and SOFT. The HARD method fails to produce music of the same quality as without control. The SOFT method generates music of the same perceptual quality as without control but fails to control the output of the network. Finally, a discussion why this might be, and ideas regarding other methods for controlling the generation of music, and sequences in general are presented. === Att kontrollera vad ett neuralt nätverk genererar har haft stor framgång när det applicerats på bilddomänen. Detta examensarbete undersöker hur liknande metoder fungerar i musikgenerering. Med hjälp av generativa motverkande nätverk tränar vi WaveNET, ett toppmodernt nätverk i ljudsyntes och generation, för att producera pianomusik. Två olika metoder för att styra genereringen presenteras, vid namn HARD och SOFT. Metoden HARD misslyckas med att producera musik av samma kvalitet som utan kontroll. Metoden SOFT skapar musik av samma perceptuella kvalitet som utan kontroll, men misslyckas med att styra genereringen. Vi diskuterar varför det här kan vara och presenterar idéer för andra metoder för att styra genereringen av musik och sekvenser i allmänhet.
|