Summary: | Att förutspå aktiepriser är något som undersökts i hundra- tals år och kan användas som grund för investeringsbeslut. Under senare år har maskininlärning applicerats på detta problem vilket gjort att ett flertal metoder föreslagits och den elektroniska handelns införande har gjort att högupp- löst data med nanosekundsprecision blivit tillgänglig. I den- na rapport presenteras resultat av en jämförande studie av klassificeringsmetoder som föreslagits för att förutspå ak- tieprisernas rörelser. Högupplöst data för fyra olika aktier från Stockholmsbörsen har använts för att jämföra tre olika metoder. Resultaten visar att det på grund av datas fördelning är svårt att uppnå ett tillfredsställande resultat. Priserna rör sig relativt sett mer sällan när högupplöst data används, vilket gör att ett fåtal felklassificeringar kan göra modellen otillräcklig. Skillnaderna mellan metodernas resultat anty- der dock att valet av indikatorer har stor betydelse och för vidare forskning kan det vara relevant att undersöka såväl innehåll i indata som metoder för att hantera den ojämna fördelningen. Vidare har en litteraturstudie genomförts för att un- dersöka den elektroniska handels bakgrund, syfte och på- verkan. Även om detta inte tycks ha varit det ursprungliga syftet i alla fall verkar den elektroniska handeln ha lett till mer effektiva marknader med lägre transaktionskostnader. === The prediction of stock prices has been attempted for hun- dreds of years and can be used for making investment deci- sions. In later years machine learning has been appliced to this problem, leading to the proposal of several dif- ferent methods. Furthermore, the recent introduction of electronic market places has made available high-resolution data with nanosecond precision. This report presents the results of a study comparing classification methods that have been proposed for predicting the movement of stock prices. High-resolution data from four different stocks on the Stockholm Stock Exchange has been used to compare three different methods. The results show that the distribution of the data makes it difficult to reach a satisfying result. Prices move rela- tively more rarely when high-resolution data is used, mak- ing even a few misclassifications significant. However, the differences between the methods’ results suggest that the choice of indicators is of great importance and for future research it may be relevant looking at both the content of input data and methods of handling the skewed distribu- tion. Furthermore, a literature review has been performed re- searching the electronic trading’s background, purpose and effects. Although it may not have been the intended pur- pose it seems that electronic trading has made the markets more efficient and transaction costs lower.
|