Analys av prediktiv precision av maskininlärningsalgoritmer

Maskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algor...

Full description

Bibliographic Details
Main Author: Remgård, Jonas
Format: Others
Language:Swedish
Published: Malmö högskola, Fakulteten för teknik och samhälle (TS) 2017
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971
id ndltd-UPSALLA1-oai-DiVA.org-mau-20971
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-mau-209712020-11-25T05:33:28ZAnalys av prediktiv precision av maskininlärningsalgoritmersweRemgård, JonasMalmö högskola, Fakulteten för teknik och samhälle (TS)Malmö högskola/Teknik och samhälle2017machinelearningLearning Curvedataset structureSymmetryEngineering and TechnologyTeknik och teknologierMaskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algoritmen presterar. Fyra olika typer av datamängder (Iris, Digits, Symmetriskt och Dubbelsymetriskt) studerades med hjälp av tre olika algoritmer (Support Vector Classifier, K-Nearest Neighbor och Decision Tree Classifier). Arbetet fastställer att alla tre algoritmers prestation förbättras vid större mängd inlärningsdata upp till en viss gräns, men att denna gräns är olika för varje algoritm. Datainstansernas struktur påverkar också algoritmernas prestation där dubbelsymmetri ger starkare prestation än enkelsymmetri. In recent years Machine Learning has become a popular subject. A challange that many users face is choosing the correct amount of training data. This study researches the relationship between the amount and structure of training data and the accuracy of the algorithm. Four different datasets (Iris, Digits, Symmetry and Double symmetry) were used with three different algorithms (Support Vector Classifier, K-Nearest Neighbor and Decision Tree Classifier). This study concludes that all algorithms perform better with more training data up to a certain limit, which is different for each algorithm. The structure of the dataset also affects the performance, where double symmetry gives greater performance than simple symmetry. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971Local 23320application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic machinelearning
Learning Curve
dataset structure
Symmetry
Engineering and Technology
Teknik och teknologier
spellingShingle machinelearning
Learning Curve
dataset structure
Symmetry
Engineering and Technology
Teknik och teknologier
Remgård, Jonas
Analys av prediktiv precision av maskininlärningsalgoritmer
description Maskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algoritmen presterar. Fyra olika typer av datamängder (Iris, Digits, Symmetriskt och Dubbelsymetriskt) studerades med hjälp av tre olika algoritmer (Support Vector Classifier, K-Nearest Neighbor och Decision Tree Classifier). Arbetet fastställer att alla tre algoritmers prestation förbättras vid större mängd inlärningsdata upp till en viss gräns, men att denna gräns är olika för varje algoritm. Datainstansernas struktur påverkar också algoritmernas prestation där dubbelsymmetri ger starkare prestation än enkelsymmetri. === In recent years Machine Learning has become a popular subject. A challange that many users face is choosing the correct amount of training data. This study researches the relationship between the amount and structure of training data and the accuracy of the algorithm. Four different datasets (Iris, Digits, Symmetry and Double symmetry) were used with three different algorithms (Support Vector Classifier, K-Nearest Neighbor and Decision Tree Classifier). This study concludes that all algorithms perform better with more training data up to a certain limit, which is different for each algorithm. The structure of the dataset also affects the performance, where double symmetry gives greater performance than simple symmetry.
author Remgård, Jonas
author_facet Remgård, Jonas
author_sort Remgård, Jonas
title Analys av prediktiv precision av maskininlärningsalgoritmer
title_short Analys av prediktiv precision av maskininlärningsalgoritmer
title_full Analys av prediktiv precision av maskininlärningsalgoritmer
title_fullStr Analys av prediktiv precision av maskininlärningsalgoritmer
title_full_unstemmed Analys av prediktiv precision av maskininlärningsalgoritmer
title_sort analys av prediktiv precision av maskininlärningsalgoritmer
publisher Malmö högskola, Fakulteten för teknik och samhälle (TS)
publishDate 2017
url http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971
work_keys_str_mv AT remgardjonas analysavprediktivprecisionavmaskininlarningsalgoritmer
_version_ 1719362198598320128