Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA

In recent years, the use of machine learning has increased significantly. Its uses range from making the everyday life easier with voice-guided smart devices to image recognition, or predicting the stock market. Predicting economic values has long been possible by using methods other than machine le...

Full description

Bibliographic Details
Main Author: Wågberg, Max
Format: Others
Language:Swedish
Published: Mittuniversitetet, Institutionen för informationssystem och –teknologi 2019
Subjects:
SVR
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-36479
id ndltd-UPSALLA1-oai-DiVA.org-miun-36479
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-miun-364792019-06-26T22:11:34ZAtt förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMAsweWågberg, MaxMittuniversitetet, Institutionen för informationssystem och –teknologi2019Machine-learningPythonARIMASVRTimeseriesRegressionMaskininlärningPythonARIMASVRTidsserieRegressionSoftware EngineeringProgramvaruteknikIn recent years, the use of machine learning has increased significantly. Its uses range from making the everyday life easier with voice-guided smart devices to image recognition, or predicting the stock market. Predicting economic values has long been possible by using methods other than machine learning, such as statistical algorithms. These algorithms and machine learning models use time series, which is a set of data points observed constantly over a given time interval, in order to predict data points beyond the original time series. But which of these methods gives the best results? The overall purpose of this project is to predict Sweden’s aid curve using the machine learning model Support Vector Regression and the classic statistical algorithm autoregressive integrated moving average which is abbreviated ARIMA. The time series used in the prediction are annual summaries of Sweden’s total aid to the world from openaid.se since 1998 and up to 2019. SVR and ARIMA are implemented in python with the help of the Scikit- and Statsmodels libraries. The results from SVR and ARIMA are measured in comparison with the original value and their predicted values, while the accuracy is measured in Root Square Mean Error and presented in the results chapter. The result shows that SVR with the RBF-kernel is the algorithm that provides the best results for the data series. All predictions beyond the times series are then visually presented on a openaid prototype page using D3.js Under det senaste åren har användningen av maskininlärning ökat markant. Dess användningsområden varierar mellan allt från att göra vardagen lättare med röststyrda smarta enheter till bildigenkänning eller att förutspå börsvärden. Att förutspå ekonomiska värden har länge varit möjligt med hjälp av andra metoder än maskininlärning, såsom exempel statistiska algoritmer. Dessa algoritmer och maskininlärningsmodeller använder tidsserier, vilket är en samling datapunkter observerade konstant över en given tidsintervall, för att kunna förutspå datapunkter bortom den originella tidsserien. Men vilken av dessa metoder ger bäst resultat? Projektets övergripande syfte är att förutse sveriges biståndskurva med hjälp av maskininlärningsmodellen Support Vector Regression och den klassiska statistiska algoritmen autoregressive integrated moving average som förkortas ARIMA. Tidsserien som används vid förutsägelsen är årliga summeringar av biståndet från openaid.se sedan år 1998 och fram till 2019. SVR och ARIMA implementeras i python med hjälp av Scikit-learn och Statsmodelsbiblioteken. Resultatet från SVR och ARIMA mäts i jämförelse mellan det originala värdet och deras förutspådda värden medan noggrannheten mäts i root square mean error och presenteras under resultatkapitlet. Resultatet visar att SVR med RBF kärnan är den algoritm som ger det bästa testresultatet för dataserien. Alla förutsägelser bortom tidsserien presenteras därefter visuellt på en openaid prototypsida med hjälp av D3.js. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-36479Local DT-V19-G3-018application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic Machine-learning
Python
ARIMA
SVR
Timeseries
Regression
Maskininlärning
Python
ARIMA
SVR
Tidsserie
Regression
Software Engineering
Programvaruteknik
spellingShingle Machine-learning
Python
ARIMA
SVR
Timeseries
Regression
Maskininlärning
Python
ARIMA
SVR
Tidsserie
Regression
Software Engineering
Programvaruteknik
Wågberg, Max
Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA
description In recent years, the use of machine learning has increased significantly. Its uses range from making the everyday life easier with voice-guided smart devices to image recognition, or predicting the stock market. Predicting economic values has long been possible by using methods other than machine learning, such as statistical algorithms. These algorithms and machine learning models use time series, which is a set of data points observed constantly over a given time interval, in order to predict data points beyond the original time series. But which of these methods gives the best results? The overall purpose of this project is to predict Sweden’s aid curve using the machine learning model Support Vector Regression and the classic statistical algorithm autoregressive integrated moving average which is abbreviated ARIMA. The time series used in the prediction are annual summaries of Sweden’s total aid to the world from openaid.se since 1998 and up to 2019. SVR and ARIMA are implemented in python with the help of the Scikit- and Statsmodels libraries. The results from SVR and ARIMA are measured in comparison with the original value and their predicted values, while the accuracy is measured in Root Square Mean Error and presented in the results chapter. The result shows that SVR with the RBF-kernel is the algorithm that provides the best results for the data series. All predictions beyond the times series are then visually presented on a openaid prototype page using D3.js === Under det senaste åren har användningen av maskininlärning ökat markant. Dess användningsområden varierar mellan allt från att göra vardagen lättare med röststyrda smarta enheter till bildigenkänning eller att förutspå börsvärden. Att förutspå ekonomiska värden har länge varit möjligt med hjälp av andra metoder än maskininlärning, såsom exempel statistiska algoritmer. Dessa algoritmer och maskininlärningsmodeller använder tidsserier, vilket är en samling datapunkter observerade konstant över en given tidsintervall, för att kunna förutspå datapunkter bortom den originella tidsserien. Men vilken av dessa metoder ger bäst resultat? Projektets övergripande syfte är att förutse sveriges biståndskurva med hjälp av maskininlärningsmodellen Support Vector Regression och den klassiska statistiska algoritmen autoregressive integrated moving average som förkortas ARIMA. Tidsserien som används vid förutsägelsen är årliga summeringar av biståndet från openaid.se sedan år 1998 och fram till 2019. SVR och ARIMA implementeras i python med hjälp av Scikit-learn och Statsmodelsbiblioteken. Resultatet från SVR och ARIMA mäts i jämförelse mellan det originala värdet och deras förutspådda värden medan noggrannheten mäts i root square mean error och presenteras under resultatkapitlet. Resultatet visar att SVR med RBF kärnan är den algoritm som ger det bästa testresultatet för dataserien. Alla förutsägelser bortom tidsserien presenteras därefter visuellt på en openaid prototypsida med hjälp av D3.js.
author Wågberg, Max
author_facet Wågberg, Max
author_sort Wågberg, Max
title Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA
title_short Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA
title_full Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA
title_fullStr Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA
title_full_unstemmed Att förutspå Sveriges bistånd : En jämförelse mellan Support Vector Regression och ARIMA
title_sort att förutspå sveriges bistånd : en jämförelse mellan support vector regression och arima
publisher Mittuniversitetet, Institutionen för informationssystem och –teknologi
publishDate 2019
url http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-36479
work_keys_str_mv AT wagbergmax attforutspasverigesbistandenjamforelsemellansupportvectorregressionocharima
_version_ 1719209551699378176