Summary: | In this bachelor thesis we investigate the importance of feature selection when making predictions on time series data. We compare how well different deep neural network models perform within equity securities time series prediction, namely the models RNN (Recurrent Neural Network), LSTM (Long Short Term Memory), LSTM with a peephole connection and last but not least GRU (Gated Recurrent Unit). We also briefly look at a simpler prediction model, a regression application of the Support Vector Machine, SVR. We compare the different techniques in terms of prediction accuracy with two commonly used error metrics, the mean absolute error (MSE) and the root mean square error (RMSE). The GRU cell had the highest accuracy out of the models on all of the used stocks, not the LSTM. This could be due to the dataset size being to small for the LSTM implementations to perform at their best. There were no significant improvements in prediction accuracy for feature selection over multiple stocks and time periods. The initial plan for this research was to investigate times series prediction accuracy of Neural ODEs. Extensive research wad made on the topic of Neural ODEs, but we failed to implement it properly on time series data as a result of knowledge-gaps and time constraints. Hence the study was re-framed, but it is still largely connected to Neural ODEs as we have conducted a brief literature study on one of the most trending statistical learning subjects of recent years. === I denna kandidatuppsats undersöker vi vikten av attributsurvalsmetoder inom ramen för prognoser med tidsserier. Vi jämför hur väl olika djupa neurala nätverksmodeller presterar för en handfull aktieprognoser, närmare bestämt modellerna RNN (Recurrent Neural Network), LSTM (Long Short Term Memory), LSTM Peephole och sist men inte minst GRU (Gated Recurrent Unit). Vi tittar också kort på en enklare prognosmodell i form av en regressionsapplikation av Support Vector Machine, SVR. Vi jämför de olika teknikerna när det gäller förutsägbarhetsnoggrannhet med två vanligt förekommande felmått: det genomsnittliga absoluta felet (MSE) och rotmedelmåttfelet (RMSE). Av modellerna vi undersökte presterade GRU bäst, inte LSTM. Detta kan bero på att storleken på de till synes stora dataset som används är för liten för vad LSTM-implementeringarna behöver för att fungera som bäst. Det gjordes inga signifikanta förbättringar i förutsägbarhetsnoggrannheten för val av funktioner under flera lager och tidsperioder. Det ursprungliga målet med denna uppsats var att undersöka hur pass bra det gick att göra tidsserieprognoser med den relativt nya tekniken Neurala ODE:er. Omfattande arbete gjordes inom ämnet men vi lyckades inte implementera tekniken korrekt för studier inom tidsserieprognoser, primärt på grund av ämnets komplexitet samt tidsbegränsningar. Således omformulerades frågeformuleringarna, dock är studien fortfarande starkt knuten till Neurala ODE:er då den innehåller en enklare litteraturstudie inom ämnet.
|