Analys av prediktiv precision av maskininlärningsalgoritmer

Maskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algor...

Full description

Bibliographic Details
Main Author:	Remgård, Jonas
Format:	Others
Language:	Swedish
Published:	Malmö högskola, Fakulteten för teknik och samhälle (TS) 2017
Subjects:	machinelearning Learning Curve dataset structure Symmetry Engineering and Technology Teknik och teknologier
Online Access:	http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971

id	ndltd-UPSALLA1-oai-DiVA.org-mau-20971
record_format	oai_dc
spelling	ndltd-UPSALLA1-oai-DiVA.org-mau-209712020-11-25T05:33:28ZAnalys av prediktiv precision av maskininlärningsalgoritmersweRemgård, JonasMalmö högskola, Fakulteten för teknik och samhälle (TS)Malmö högskola/Teknik och samhälle2017machinelearningLearning Curvedataset structureSymmetryEngineering and TechnologyTeknik och teknologierMaskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algoritmen presterar. Fyra olika typer av datamängder (Iris, Digits, Symmetriskt och Dubbelsymetriskt) studerades med hjälp av tre olika algoritmer (Support Vector Classifier, K-Nearest Neighbor och Decision Tree Classifier). Arbetet fastställer att alla tre algoritmers prestation förbättras vid större mängd inlärningsdata upp till en viss gräns, men att denna gräns är olika för varje algoritm. Datainstansernas struktur påverkar också algoritmernas prestation där dubbelsymmetri ger starkare prestation än enkelsymmetri. In recent years Machine Learning has become a popular subject. A challange that many users face is choosing the correct amount of training data. This study researches the relationship between the amount and structure of training data and the accuracy of the algorithm. Four different datasets (Iris, Digits, Symmetry and Double symmetry) were used with three different algorithms (Support Vector Classifier, K-Nearest Neighbor and Decision Tree Classifier). This study concludes that all algorithms perform better with more training data up to a certain limit, which is different for each algorithm. The structure of the dataset also affects the performance, where double symmetry gives greater performance than simple symmetry. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971Local 23320application/pdfinfo:eu-repo/semantics/openAccess
collection	NDLTD
language	Swedish
format	Others
sources	NDLTD
topic	machinelearning Learning Curve dataset structure Symmetry Engineering and Technology Teknik och teknologier
spellingShingle	machinelearning Learning Curve dataset structure Symmetry Engineering and Technology Teknik och teknologier Remgård, Jonas Analys av prediktiv precision av maskininlärningsalgoritmer
description	Maskininlärning (eng: Machine Learning) har på senare tid blivit ett populärt ämne. En fråga som många användare ställer sig är hur mycket data det behövs för att få ett så korrekt svar som möjligt. Detta arbete undersöker relationen mellan inlärningsdata, mängd såväl som struktur, och hur väl algoritmen presterar. Fyra olika typer av datamängder (Iris, Digits, Symmetriskt och Dubbelsymetriskt) studerades med hjälp av tre olika algoritmer (Support Vector Classifier, K-Nearest Neighbor och Decision Tree Classifier). Arbetet fastställer att alla tre algoritmers prestation förbättras vid större mängd inlärningsdata upp till en viss gräns, men att denna gräns är olika för varje algoritm. Datainstansernas struktur påverkar också algoritmernas prestation där dubbelsymmetri ger starkare prestation än enkelsymmetri. === In recent years Machine Learning has become a popular subject. A challange that many users face is choosing the correct amount of training data. This study researches the relationship between the amount and structure of training data and the accuracy of the algorithm. Four different datasets (Iris, Digits, Symmetry and Double symmetry) were used with three different algorithms (Support Vector Classifier, K-Nearest Neighbor and Decision Tree Classifier). This study concludes that all algorithms perform better with more training data up to a certain limit, which is different for each algorithm. The structure of the dataset also affects the performance, where double symmetry gives greater performance than simple symmetry.
author	Remgård, Jonas
author_facet	Remgård, Jonas
author_sort	Remgård, Jonas
title	Analys av prediktiv precision av maskininlärningsalgoritmer
title_short	Analys av prediktiv precision av maskininlärningsalgoritmer
title_full	Analys av prediktiv precision av maskininlärningsalgoritmer
title_fullStr	Analys av prediktiv precision av maskininlärningsalgoritmer
title_full_unstemmed	Analys av prediktiv precision av maskininlärningsalgoritmer
title_sort	analys av prediktiv precision av maskininlärningsalgoritmer
publisher	Malmö högskola, Fakulteten för teknik och samhälle (TS)
publishDate	2017
url	http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-20971
work_keys_str_mv	AT remgardjonas analysavprediktivprecisionavmaskininlarningsalgoritmer
_version_	1719362198598320128

Analys av prediktiv precision av maskininlärningsalgoritmer

Similar Items