Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models

The prediction and understanding of market fluctuations are of great interest in today’s society. A common tool for analyzing financial data is the use of different statistical models. This report will focus on examining the stability of a financial data sequence using a statistical model. The seque...

Full description

Bibliographic Details
Main Authors: Carlsson, Anders, Lauri, Linus
Format: Others
Language:English
Published: KTH, Matematisk statistik 2011
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-105526
id ndltd-UPSALLA1-oai-DiVA.org-kth-105526
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-1055262013-02-14T16:05:55ZModellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov ModelsengCarlsson, AndersLauri, LinusKTH, Matematisk statistikKTH, Matematisk statistik2011The prediction and understanding of market fluctuations are of great interest in today’s society. A common tool for analyzing financial data is the use of different statistical models. This report will focus on examining the stability of a financial data sequence using a statistical model. The sequence that will be used in the report is the logarithmic return of OMXS30 index between the 30th of March 2005 and the 6th of March 2009. The statistical model that will be used is a HMM ( Hidden Markov Model). This model consists essentially of two stochastic processes:  A non-observable Markov chain in a finite state space.  A state-dependent process with a superimposed white noise. The latter of these two processes is generally known. Therefore, the key is to find how the hidden Markov chain behaves. This will be solved with the so-called EM-algorithm, which is an iterative method to get the model to converge. An optimization of the model with respect to the number of states will be made with the BIC (Bayesian Information Criterion). Thereafter, a validation of the model is done by graphically comparing the quantiles of the model distribution function and the given data. This study shows that by employing an HMM it is possible to describe how the return on the index varies, by examining the probability of changes between the Markov chains volatility states. I dagens samhälle finns det ett stort intresse i att kunna analysera finansiella data och skapa sig en uppfattning om hur marknaden utveck-las. Olika statistiska modeller är de vanligaste verktygen för att kunna göra denna analys. Den här rapporten fokuserar på att med hjälp av en statistisk modell undersöka stabiliteten på en finansiell datasekvens. Datasekvensen kommer i rapporten vara de logaritmiska dagsavkastningarna på OMXS30-index mellan den 30e mars 2005 och den 6e mars 2009. Den statistiska modellen som kommer användas är en så kallad dold Markovmodell eller HMM ( Hidden Markov Model). Modellen består huvudsakligen av två stokastiska processer:  En icke observerbar Markovkedja i ett ändligt tillståndsrum.  En tillståndsberoende process med ett pålagt vitt brus. Den senare av dessa två processer är vanligtvis känd. Problemet blir därför att försöka hitta hur den dolda Markovkedjan uppför sig. Detta löses med den så kallade EM-algoritmen, vilket är en iterativ metod för att få modellen att konvergera. Därefter genomförs en optimering med avseende på antal tillstånd med BIC ( Bayesian Information Criterion), varefter en validering av modellen utförs, genom att grafiskt jämföra kvantilerna för modellens fördelningsfunktion med den observerade datamängden. Studien visar att det med hjälp av en HMM är möjligt att beskriva hur avkastningen på index varierar. Detta genom att undersöka hur sanno-likt det är för förändringar mellan Markovkedjans volatilitetstillstånd. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-105526application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
description The prediction and understanding of market fluctuations are of great interest in today’s society. A common tool for analyzing financial data is the use of different statistical models. This report will focus on examining the stability of a financial data sequence using a statistical model. The sequence that will be used in the report is the logarithmic return of OMXS30 index between the 30th of March 2005 and the 6th of March 2009. The statistical model that will be used is a HMM ( Hidden Markov Model). This model consists essentially of two stochastic processes:  A non-observable Markov chain in a finite state space.  A state-dependent process with a superimposed white noise. The latter of these two processes is generally known. Therefore, the key is to find how the hidden Markov chain behaves. This will be solved with the so-called EM-algorithm, which is an iterative method to get the model to converge. An optimization of the model with respect to the number of states will be made with the BIC (Bayesian Information Criterion). Thereafter, a validation of the model is done by graphically comparing the quantiles of the model distribution function and the given data. This study shows that by employing an HMM it is possible to describe how the return on the index varies, by examining the probability of changes between the Markov chains volatility states. === I dagens samhälle finns det ett stort intresse i att kunna analysera finansiella data och skapa sig en uppfattning om hur marknaden utveck-las. Olika statistiska modeller är de vanligaste verktygen för att kunna göra denna analys. Den här rapporten fokuserar på att med hjälp av en statistisk modell undersöka stabiliteten på en finansiell datasekvens. Datasekvensen kommer i rapporten vara de logaritmiska dagsavkastningarna på OMXS30-index mellan den 30e mars 2005 och den 6e mars 2009. Den statistiska modellen som kommer användas är en så kallad dold Markovmodell eller HMM ( Hidden Markov Model). Modellen består huvudsakligen av två stokastiska processer:  En icke observerbar Markovkedja i ett ändligt tillståndsrum.  En tillståndsberoende process med ett pålagt vitt brus. Den senare av dessa två processer är vanligtvis känd. Problemet blir därför att försöka hitta hur den dolda Markovkedjan uppför sig. Detta löses med den så kallade EM-algoritmen, vilket är en iterativ metod för att få modellen att konvergera. Därefter genomförs en optimering med avseende på antal tillstånd med BIC ( Bayesian Information Criterion), varefter en validering av modellen utförs, genom att grafiskt jämföra kvantilerna för modellens fördelningsfunktion med den observerade datamängden. Studien visar att det med hjälp av en HMM är möjligt att beskriva hur avkastningen på index varierar. Detta genom att undersöka hur sanno-likt det är för förändringar mellan Markovkedjans volatilitetstillstånd.
author Carlsson, Anders
Lauri, Linus
spellingShingle Carlsson, Anders
Lauri, Linus
Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models
author_facet Carlsson, Anders
Lauri, Linus
author_sort Carlsson, Anders
title Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models
title_short Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models
title_full Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models
title_fullStr Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models
title_full_unstemmed Modellering av finansiella data med dolda markovmodeller / Analysis of Financial Data with Hidden Markov Models
title_sort modellering av finansiella data med dolda markovmodeller / analysis of financial data with hidden markov models
publisher KTH, Matematisk statistik
publishDate 2011
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-105526
work_keys_str_mv AT carlssonanders modelleringavfinansielladatameddoldamarkovmodelleranalysisoffinancialdatawithhiddenmarkovmodels
AT laurilinus modelleringavfinansielladatameddoldamarkovmodelleranalysisoffinancialdatawithhiddenmarkovmodels
_version_ 1716577069461143552