Time-Series Feature Extraction in Embedded Sensor Processing System

Embedded sensor-based systems mounted with tens or hundreds of sensors can collect enormous time-series data, while the data analysis on those time-series is commonly conducted on the remote server-side. With the development of microprocessors, there have been increasing demands to move the analysis...

Full description

Bibliographic Details
Main Author: Zhu, Wenyao
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2020
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-281820
id ndltd-UPSALLA1-oai-DiVA.org-kth-281820
record_format oai_dc
collection NDLTD
language English
format Others
sources NDLTD
topic Computer and Information Sciences
Data- och informationsvetenskap
spellingShingle Computer and Information Sciences
Data- och informationsvetenskap
Zhu, Wenyao
Time-Series Feature Extraction in Embedded Sensor Processing System
description Embedded sensor-based systems mounted with tens or hundreds of sensors can collect enormous time-series data, while the data analysis on those time-series is commonly conducted on the remote server-side. With the development of microprocessors, there have been increasing demands to move the analysis process to the local embedded systems. In this thesis, the objective is to inves- tigate the possibility of the time-series feature extraction methods suitable for the embedded sensor processing systems.As the research problem raised from the objective, we have explored the traditional statistic methods and machine learning approaches on time-series data mining. To narrow down the research scope, the thesis focuses on the similarity search methods together with the clustering algorithms from the time-series feature extraction perspective. In the project, we have chosen and implemented two clustering algorithms, the K-means and the Self-Organizing Map (SOM), combined with two similarity search methods, the Euclidean dis- tance and the Dynamic Time Warping (DTW). The evaluation setup uses four public datasets with labels, and the Rand index (RI) to score the accuracy. We have tested the performance on accuracy and time consumption of the four combinations of the chosen algorithms on the embedded platform.The results show that the SOM with DTW can generally achieve better accuracy with a relatively longer inferring time than the other evaluated meth- ods. Quantitatively, the SOM with DTW can do clustering on one time-series sample of 300 data points for twelve classes in 40 ms using the ESP32 embed- ded microprocessor, with a 4 percentage of accuracy advantage than the fastest K-means with Euclidean distance in RI score. We can conclude that the SOM with DTW algorithm can be used to handle the time-series clustering tasks on the embedded sensor processing systems if the timing requirement is not so stringent. === Inbyggda sensorbaserade system monterade med tiotals eller hundratals senso- rer kan samla in enorma tidsseriedata, medan dataanalysen på dessa tidsserier vanligtvis utförs på en fjärrserver. Med utvecklingen av mikroprocessorer har behovet att flytta analysprocessen till de lokala inbäddade systemen ökat. I detta examensarbete är målet att undersöka vilka tidsserie-extraktionsmetoder som är lämpliga för de inbäddade sensorbehandlingssystemen.Som forskningsproblem för målet har vi undersökt traditionella statistik- metoder och maskininlärningsmetoder för tidsserie-data mining. För att be- gränsa forskningsområdet fokuserar examensarbet på likhetssökningsmetoder tillsammans med klusteralgoritmer från tidsserieens feature extraktionsper- spektiv. I projektet har vi valt och implementerat två klusteralgoritmer, K- means och Self-Organizing Map (SOM), i kombination med två likhetssök- ningsmetoder, det euklidiska avståndet och Dynamic Time Warping (DTW). Resultaten utvärderas med fyra offentliga datasätt med märkt data. Randin- dex (RI) används för att utvärdera noggrannheten. Vi har testat prestandan för noggrannhet och tidsförbrukning för de fyra kombinationerna av de valda al- goritmerna på den inbäddade plattformen.Resultaten visar att SOM med DTW i allmänhet kan uppnå bättre nog- grannhet med en relativt längre inferenstid än de andra utvärderade metoder- na. Kvantitativt kan SOM med DTW uföra klustring på ett tidsserieprov med 300 datapunkter för tolv klasser på 40 ms med en ESP32-inbäddad mikropro- cessor, vilket är en 4-procentig förbättring i noggrannhet i RI-poäng jämfört med det snabbaste K-medel klustringen med Euklidiskt avstånd. Vi drar slut- satsen att SOM med DTW algoritmen kan användas för att hantera tidsserie- klusteruppgifter på de inbäddade sensorbehandlingssystemen om tidsbehovet inte är så strängt.
author Zhu, Wenyao
author_facet Zhu, Wenyao
author_sort Zhu, Wenyao
title Time-Series Feature Extraction in Embedded Sensor Processing System
title_short Time-Series Feature Extraction in Embedded Sensor Processing System
title_full Time-Series Feature Extraction in Embedded Sensor Processing System
title_fullStr Time-Series Feature Extraction in Embedded Sensor Processing System
title_full_unstemmed Time-Series Feature Extraction in Embedded Sensor Processing System
title_sort time-series feature extraction in embedded sensor processing system
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2020
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-281820
work_keys_str_mv AT zhuwenyao timeseriesfeatureextractioninembeddedsensorprocessingsystem
_version_ 1719340442531659776
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2818202020-09-25T06:01:58ZTime-Series Feature Extraction in Embedded Sensor Processing SystemengZhu, WenyaoKTH, Skolan för elektroteknik och datavetenskap (EECS)2020Computer and Information SciencesData- och informationsvetenskapEmbedded sensor-based systems mounted with tens or hundreds of sensors can collect enormous time-series data, while the data analysis on those time-series is commonly conducted on the remote server-side. With the development of microprocessors, there have been increasing demands to move the analysis process to the local embedded systems. In this thesis, the objective is to inves- tigate the possibility of the time-series feature extraction methods suitable for the embedded sensor processing systems.As the research problem raised from the objective, we have explored the traditional statistic methods and machine learning approaches on time-series data mining. To narrow down the research scope, the thesis focuses on the similarity search methods together with the clustering algorithms from the time-series feature extraction perspective. In the project, we have chosen and implemented two clustering algorithms, the K-means and the Self-Organizing Map (SOM), combined with two similarity search methods, the Euclidean dis- tance and the Dynamic Time Warping (DTW). The evaluation setup uses four public datasets with labels, and the Rand index (RI) to score the accuracy. We have tested the performance on accuracy and time consumption of the four combinations of the chosen algorithms on the embedded platform.The results show that the SOM with DTW can generally achieve better accuracy with a relatively longer inferring time than the other evaluated meth- ods. Quantitatively, the SOM with DTW can do clustering on one time-series sample of 300 data points for twelve classes in 40 ms using the ESP32 embed- ded microprocessor, with a 4 percentage of accuracy advantage than the fastest K-means with Euclidean distance in RI score. We can conclude that the SOM with DTW algorithm can be used to handle the time-series clustering tasks on the embedded sensor processing systems if the timing requirement is not so stringent. Inbyggda sensorbaserade system monterade med tiotals eller hundratals senso- rer kan samla in enorma tidsseriedata, medan dataanalysen på dessa tidsserier vanligtvis utförs på en fjärrserver. Med utvecklingen av mikroprocessorer har behovet att flytta analysprocessen till de lokala inbäddade systemen ökat. I detta examensarbete är målet att undersöka vilka tidsserie-extraktionsmetoder som är lämpliga för de inbäddade sensorbehandlingssystemen.Som forskningsproblem för målet har vi undersökt traditionella statistik- metoder och maskininlärningsmetoder för tidsserie-data mining. För att be- gränsa forskningsområdet fokuserar examensarbet på likhetssökningsmetoder tillsammans med klusteralgoritmer från tidsserieens feature extraktionsper- spektiv. I projektet har vi valt och implementerat två klusteralgoritmer, K- means och Self-Organizing Map (SOM), i kombination med två likhetssök- ningsmetoder, det euklidiska avståndet och Dynamic Time Warping (DTW). Resultaten utvärderas med fyra offentliga datasätt med märkt data. Randin- dex (RI) används för att utvärdera noggrannheten. Vi har testat prestandan för noggrannhet och tidsförbrukning för de fyra kombinationerna av de valda al- goritmerna på den inbäddade plattformen.Resultaten visar att SOM med DTW i allmänhet kan uppnå bättre nog- grannhet med en relativt längre inferenstid än de andra utvärderade metoder- na. Kvantitativt kan SOM med DTW uföra klustring på ett tidsserieprov med 300 datapunkter för tolv klasser på 40 ms med en ESP32-inbäddad mikropro- cessor, vilket är en 4-procentig förbättring i noggrannhet i RI-poäng jämfört med det snabbaste K-medel klustringen med Euklidiskt avstånd. Vi drar slut- satsen att SOM med DTW algoritmen kan användas för att hantera tidsserie- klusteruppgifter på de inbäddade sensorbehandlingssystemen om tidsbehovet inte är så strängt. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-281820TRITA-EECS-EX ; 2020:642application/pdfinfo:eu-repo/semantics/openAccess