Analys av prediktiv precision av maskininlärningsalgoritmer
Maskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algor...
Main Author: | |
---|---|
Format: | Others |
Language: | Swedish |
Published: |
Malmö högskola, Fakulteten för teknik och samhälle (TS)
2017
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971 |
id |
ndltd-UPSALLA1-oai-DiVA.org-mau-20971 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-mau-209712020-11-25T05:33:28ZAnalys av prediktiv precision av maskininlärningsalgoritmersweRemgård, JonasMalmö högskola, Fakulteten för teknik och samhälle (TS)Malmö högskola/Teknik och samhälle2017machinelearningLearning Curvedataset structureSymmetryEngineering and TechnologyTeknik och teknologierMaskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algoritmen presterar. Fyra olika typer av datamängder (Iris, Digits, Symmetriskt och Dubbelsymetriskt) studerades med hjälp av tre olika algoritmer (Support Vector Classifier, K-Nearest Neighbor och Decision Tree Classifier). Arbetet fastställer att alla tre algoritmers prestation förbättras vid större mängd inlärningsdata upp till en viss gräns, men att denna gräns är olika för varje algoritm. Datainstansernas struktur påverkar också algoritmernas prestation där dubbelsymmetri ger starkare prestation än enkelsymmetri. In recent years Machine Learning has become a popular subject. A challange that many users face is choosing the correct amount of training data. This study researches the relationship between the amount and structure of training data and the accuracy of the algorithm. Four different datasets (Iris, Digits, Symmetry and Double symmetry) were used with three different algorithms (Support Vector Classifier, K-Nearest Neighbor and Decision Tree Classifier). This study concludes that all algorithms perform better with more training data up to a certain limit, which is different for each algorithm. The structure of the dataset also affects the performance, where double symmetry gives greater performance than simple symmetry. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971Local 23320application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
Swedish |
format |
Others
|
sources |
NDLTD |
topic |
machinelearning Learning Curve dataset structure Symmetry Engineering and Technology Teknik och teknologier |
spellingShingle |
machinelearning Learning Curve dataset structure Symmetry Engineering and Technology Teknik och teknologier Remgård, Jonas Analys av prediktiv precision av maskininlärningsalgoritmer |
description |
Maskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algoritmen presterar. Fyra olika typer av datamängder (Iris, Digits, Symmetriskt och Dubbelsymetriskt) studerades med hjälp av tre olika algoritmer (Support Vector Classifier, K-Nearest Neighbor och Decision Tree Classifier). Arbetet fastställer att alla tre algoritmers prestation förbättras vid större mängd inlärningsdata upp till en viss gräns, men att denna gräns är olika för varje algoritm. Datainstansernas struktur påverkar också algoritmernas prestation där dubbelsymmetri ger starkare prestation än enkelsymmetri. === In recent years Machine Learning has become a popular subject. A challange that many users face is choosing the correct amount of training data. This study researches the relationship between the amount and structure of training data and the accuracy of the algorithm. Four different datasets (Iris, Digits, Symmetry and Double symmetry) were used with three different algorithms (Support Vector Classifier, K-Nearest Neighbor and Decision Tree Classifier). This study concludes that all algorithms perform better with more training data up to a certain limit, which is different for each algorithm. The structure of the dataset also affects the performance, where double symmetry gives greater performance than simple symmetry. |
author |
Remgård, Jonas |
author_facet |
Remgård, Jonas |
author_sort |
Remgård, Jonas |
title |
Analys av prediktiv precision av maskininlärningsalgoritmer |
title_short |
Analys av prediktiv precision av maskininlärningsalgoritmer |
title_full |
Analys av prediktiv precision av maskininlärningsalgoritmer |
title_fullStr |
Analys av prediktiv precision av maskininlärningsalgoritmer |
title_full_unstemmed |
Analys av prediktiv precision av maskininlärningsalgoritmer |
title_sort |
analys av prediktiv precision av maskininlärningsalgoritmer |
publisher |
Malmö högskola, Fakulteten för teknik och samhälle (TS) |
publishDate |
2017 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971 |
work_keys_str_mv |
AT remgardjonas analysavprediktivprecisionavmaskininlarningsalgoritmer |
_version_ |
1719362198598320128 |