Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter

Denna rapport har använt sig av Unity-verktyget ML-Agents till att bygga upp en spelmiljö där agenter tränats med hjälp av neurala nätverk och reinforcement learning. Miljön har utmanat agenterna med labyrintliknande banor där vissa även har enkla pusselmekaniker. Agenterna har sedan använts för att...

Full description

Bibliographic Details
Main Author: Pettersson, Oscar
Format: Others
Language:Swedish
Published: Högskolan i Skövde, Institutionen för informationsteknologi 2019
Subjects:
ai
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-17142
id ndltd-UPSALLA1-oai-DiVA.org-his-17142
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-his-171422019-06-19T05:30:53ZMachine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agentersweMachine Learning Agents : A study regarding Curiosity as a reward incentive for machine learning agentsPettersson, OscarHögskolan i Skövde, Institutionen för informationsteknologi2019maskininlärningaicuriosityunityComputer and Information SciencesData- och informationsvetenskapDenna rapport har använt sig av Unity-verktyget ML-Agents till att bygga upp en spelmiljö där agenter tränats med hjälp av neurala nätverk och reinforcement learning. Miljön har utmanat agenterna med labyrintliknande banor där vissa även har enkla pusselmekaniker. Agenterna har sedan använts för att göra en undersökning om hur belöningssystemet Curiosity påverkar agentens förmåga att efter träning klara av för dem nya banor. Denna undersökning gjordes genom att träna 5 olika agenter under samma förhållanden där enbart styrkan på Curiosity-incitamentet skiljde dem åt. De olika Curiosity-styrkor som undersöktes var styrkorna: 0, 0.002, 0.033, 0.067 och 0.1. Dessa agenter utvärderades genom att spela igenom 8 utvärderingsbanor med varierande svårighetsgrad för att se vilken av agenterna som klarade av flest banor. Varje bana spelades igenom 50 gånger och antalet avklarade försök och tiden det tog för agenten att klara av varje bana antecknades. Resultatet visade att samtliga agenter som tränats med Curiosity presterade betydligt bättre än agenten som tränats utan Curiosity. Antalet avklarade försök på utvärderingsbanorna ökade med 121%-231% då agenter tränades med Curiosity. Agenterna som tränats med Curiosity visade viss variation i hur bra de klarade av spelets banor. Den agent som presterade bäst var den med Curiosity-styrkan 0.002. Agenter som tränats med Curiosity visade sig mer benägna att undersöka banorna, vilket gjorde att de inte körde fast lika ofta som agenten som tränats utan Curiosity. Agenterna med Curiosity-styrkorna 0.033, 0.067 och 0.1 anses dock ha ett för högt värde på sin Curiosity-styrka då de uppvisat ett sämre resultat, samt ett rörelsemönster som anses icke-optimalt då de jämförs med agenten med Curiosity-styrkan 0.002. Överlag visade samtliga agenter en hög standardavvikelse, vilket innebär att det förekom hög varians försöken emellan. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-17142application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic maskininlärning
ai
curiosity
unity
Computer and Information Sciences
Data- och informationsvetenskap
spellingShingle maskininlärning
ai
curiosity
unity
Computer and Information Sciences
Data- och informationsvetenskap
Pettersson, Oscar
Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter
description Denna rapport har använt sig av Unity-verktyget ML-Agents till att bygga upp en spelmiljö där agenter tränats med hjälp av neurala nätverk och reinforcement learning. Miljön har utmanat agenterna med labyrintliknande banor där vissa även har enkla pusselmekaniker. Agenterna har sedan använts för att göra en undersökning om hur belöningssystemet Curiosity påverkar agentens förmåga att efter träning klara av för dem nya banor. Denna undersökning gjordes genom att träna 5 olika agenter under samma förhållanden där enbart styrkan på Curiosity-incitamentet skiljde dem åt. De olika Curiosity-styrkor som undersöktes var styrkorna: 0, 0.002, 0.033, 0.067 och 0.1. Dessa agenter utvärderades genom att spela igenom 8 utvärderingsbanor med varierande svårighetsgrad för att se vilken av agenterna som klarade av flest banor. Varje bana spelades igenom 50 gånger och antalet avklarade försök och tiden det tog för agenten att klara av varje bana antecknades. Resultatet visade att samtliga agenter som tränats med Curiosity presterade betydligt bättre än agenten som tränats utan Curiosity. Antalet avklarade försök på utvärderingsbanorna ökade med 121%-231% då agenter tränades med Curiosity. Agenterna som tränats med Curiosity visade viss variation i hur bra de klarade av spelets banor. Den agent som presterade bäst var den med Curiosity-styrkan 0.002. Agenter som tränats med Curiosity visade sig mer benägna att undersöka banorna, vilket gjorde att de inte körde fast lika ofta som agenten som tränats utan Curiosity. Agenterna med Curiosity-styrkorna 0.033, 0.067 och 0.1 anses dock ha ett för högt värde på sin Curiosity-styrka då de uppvisat ett sämre resultat, samt ett rörelsemönster som anses icke-optimalt då de jämförs med agenten med Curiosity-styrkan 0.002. Överlag visade samtliga agenter en hög standardavvikelse, vilket innebär att det förekom hög varians försöken emellan.
author Pettersson, Oscar
author_facet Pettersson, Oscar
author_sort Pettersson, Oscar
title Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter
title_short Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter
title_full Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter
title_fullStr Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter
title_full_unstemmed Machine Learning Agents : En undersökning om Curiosity som belöningssystem för maskininlärda agenter
title_sort machine learning agents : en undersökning om curiosity som belöningssystem för maskininlärda agenter
publisher Högskolan i Skövde, Institutionen för informationsteknologi
publishDate 2019
url http://urn.kb.se/resolve?urn=urn:nbn:se:his:diva-17142
work_keys_str_mv AT petterssonoscar machinelearningagentsenundersokningomcuriositysombeloningssystemformaskininlardaagenter
AT petterssonoscar machinelearningagentsastudyregardingcuriosityasarewardincentiveformachinelearningagents
_version_ 1719206975139479552