Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)

In this master thesis, we implement a two-step anomaly detection mechanism for non-recurrent traffic congestions with data collected from public transport buses in Stockholm. We investigate the use of machine learning to model time series data with LSTMs and evaluate the results with a baseline pred...

Full description

Bibliographic Details
Main Author: Svanberg, John
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2018
Subjects:
ML
NN
RNN
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-234465
id ndltd-UPSALLA1-oai-DiVA.org-kth-234465
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2344652018-09-22T06:40:05ZAnomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)engAvvikelsedetektering för icke återkommande trafikstockningar med hjälp av LSTM-nätverkSvanberg, JohnKTH, Skolan för elektroteknik och datavetenskap (EECS)2018MLmachine learningneural networksrecurrent neural networksNNRNNLSTMlong short-term memory networksanomaly detectionpublic transportbig datadata analysisComputer SciencesDatavetenskap (datalogi)In this master thesis, we implement a two-step anomaly detection mechanism for non-recurrent traffic congestions with data collected from public transport buses in Stockholm. We investigate the use of machine learning to model time series data with LSTMs and evaluate the results with a baseline prediction model. The anomaly detection algorithm embodies both collective and contextual expressivity, meaning it is capable of findingcollections of delayed buses and also takes the temporality of the data into account. Results show that the anomaly detection performance benefits from the lower prediction errors produced by the LSTM network. The intersection rule significantly decreases the number of false positives while maintaining the true positive rate at a sufficient level. The performance of the anomaly detection algorithm has been found to depend on the road segment it is applied to, some segments have been identified to be particularly hard whereas other have been identified to be easier than others. The performance of the best performing setup of the anomaly detection mechanism had a true positive rate of 84.3 % and a true negative rate of 96.0 %. I den här masteruppsatsen implementerar vi en tvåstegsalgoritm för avvikelsedetektering för icke återkommande trafikstockningar. Data är insamlad från kollektivtrafikbussarna i Stockholm. Vi undersöker användningen av maskininlärning för att modellerna tidsseriedata med hjälp av LSTM-nätverk och evaluerar sedan dessa resultat med en grundmodell. Avvikelsedetekteringsalgoritmen inkluderar både kollektiv och kontextuell uttrycksfullhet, vilket innebär att kollektiva förseningar kan hittas och att även temporaliteten hos datan beaktas. Resultaten visar att prestandan hos avvikelsedetekteringen förbättras av mindre prediktionsfel genererade av LSTM-nätverket i jämförelse med grundmodellen. En regel för avvikelser baserad på snittet av två andra regler reducerar märkbart antalet falska positiva medan den höll kvar antalet sanna positiva på en tillräckligt hög nivå. Prestandan hos avvikelsedetekteringsalgoritmen har setts bero av vilken vägsträcka den tillämpas på, där några vägsträckor är svårare medan andra är lättare för avvikelsedetekteringen. Den bästa varianten av algoritmen hittade 84.3 % av alla avvikelser och 96.0 % av all avvikelsefri data blev markerad som normal data. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-234465TRITA-EECS-EX ; 2018:570application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic ML
machine learning
neural networks
recurrent neural networks
NN
RNN
LSTM
long short-term memory networks
anomaly detection
public transport
big data
data analysis
Computer Sciences
Datavetenskap (datalogi)
spellingShingle ML
machine learning
neural networks
recurrent neural networks
NN
RNN
LSTM
long short-term memory networks
anomaly detection
public transport
big data
data analysis
Computer Sciences
Datavetenskap (datalogi)
Svanberg, John
Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)
description In this master thesis, we implement a two-step anomaly detection mechanism for non-recurrent traffic congestions with data collected from public transport buses in Stockholm. We investigate the use of machine learning to model time series data with LSTMs and evaluate the results with a baseline prediction model. The anomaly detection algorithm embodies both collective and contextual expressivity, meaning it is capable of findingcollections of delayed buses and also takes the temporality of the data into account. Results show that the anomaly detection performance benefits from the lower prediction errors produced by the LSTM network. The intersection rule significantly decreases the number of false positives while maintaining the true positive rate at a sufficient level. The performance of the anomaly detection algorithm has been found to depend on the road segment it is applied to, some segments have been identified to be particularly hard whereas other have been identified to be easier than others. The performance of the best performing setup of the anomaly detection mechanism had a true positive rate of 84.3 % and a true negative rate of 96.0 %. === I den här masteruppsatsen implementerar vi en tvåstegsalgoritm för avvikelsedetektering för icke återkommande trafikstockningar. Data är insamlad från kollektivtrafikbussarna i Stockholm. Vi undersöker användningen av maskininlärning för att modellerna tidsseriedata med hjälp av LSTM-nätverk och evaluerar sedan dessa resultat med en grundmodell. Avvikelsedetekteringsalgoritmen inkluderar både kollektiv och kontextuell uttrycksfullhet, vilket innebär att kollektiva förseningar kan hittas och att även temporaliteten hos datan beaktas. Resultaten visar att prestandan hos avvikelsedetekteringen förbättras av mindre prediktionsfel genererade av LSTM-nätverket i jämförelse med grundmodellen. En regel för avvikelser baserad på snittet av två andra regler reducerar märkbart antalet falska positiva medan den höll kvar antalet sanna positiva på en tillräckligt hög nivå. Prestandan hos avvikelsedetekteringsalgoritmen har setts bero av vilken vägsträcka den tillämpas på, där några vägsträckor är svårare medan andra är lättare för avvikelsedetekteringen. Den bästa varianten av algoritmen hittade 84.3 % av alla avvikelser och 96.0 % av all avvikelsefri data blev markerad som normal data.
author Svanberg, John
author_facet Svanberg, John
author_sort Svanberg, John
title Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)
title_short Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)
title_full Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)
title_fullStr Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)
title_full_unstemmed Anomaly detection for non-recurring traffic congestions using Long short-term memory networks (LSTMs)
title_sort anomaly detection for non-recurring traffic congestions using long short-term memory networks (lstms)
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2018
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-234465
work_keys_str_mv AT svanbergjohn anomalydetectionfornonrecurringtrafficcongestionsusinglongshorttermmemorynetworkslstms
AT svanbergjohn avvikelsedetekteringforickeaterkommandetrafikstockningarmedhjalpavlstmnatverk
_version_ 1718734691970842624