Summary: | Syftet med denna studie var att bygga, träna och testa two olika självkörande agenter med hjälp av maskininlärningstekniker, specifikt neurala nätverk. För att träna agenterna användes en teknik kallad Imitationsinlärning. Imitationsinlärning är en teknik för att lära agenter sekventiell beslutsfattning genom demostrering från en expert (vanligtvis en människa). Två något olika nätverksarkitekturer jämfördes. Skillnaden mellan dessa var att den kontrollmodul för en specifik intention (vilket här betecknar t.ex. åt vilket håll man ska köra i en korsning) var placerad antingen tidigt eller sent i det neurala nätverket. Testningen av de tränade modellerna observerade körningsförmåga såsom antalet lyckade intentioner och hastighet. Den tidiga modellen hade en signifikant högre hastighet än den sena modellen och verkade också köra generellt “bättre” än den sena modellen dock utan signifikans från den statistiska utvärderingen. Detta kan vara en effekt av en för liten stickprovstorlek, vilket kunde åtgärdats med användning av andra verktyg vid träning och testning. Det upptäcktes också att den tidiga modellens gas-värden som ackumulerades under testningen, var närmare expertens gas-distribution. === This study aimed to build, train, and test two different autonomous vehicle (AV) agents by using machine learning techniques, specifically neural network architectures. To be able to train the agents a technique called Imitation Learning was used. Imitation Learning is an approach for learning sequential decision-making from demonstrations provided by an expert. Two slightly different neural network architectures were compared. The difference was that the intentional command module (which denotes what direction to take in an intersection for example) was located either in the beginning or the end of the respective networks. The testing of the trained models was looking at their driving capabilities such as intentions completed and speed. The early model was significantly faster than the late model and seemed to be “better” at driving in general but with no significant difference from the late network. This could be an effect of the sample size being too small, which could have been rectified with different tools used in the training and testing. Additionally, it was found that the early model’s gas values, acquired at testing time, were closer to the expert gas distribution.
|