Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach

Following the significant transition from the traditional production industry to an informationbased economy, the telecommunications industry was faced with an explosion of innovation, resulting in a continuous change in user behaviour. The industry has made efforts to adapt to a more datadriven fut...

Full description

Bibliographic Details
Main Author: Forsare Källman, Povel
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2021
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-305061
id ndltd-UPSALLA1-oai-DiVA.org-kth-305061
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-3050612021-11-23T05:44:35ZUnsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering ApproachengForsare Källman, PovelKTH, Skolan för elektroteknik och datavetenskap (EECS)2021Anomaly DetectionRoot Cause AnalysisCluster Analysisk- meansSelf- Organizing MapGaussian Mixture ModelDimensionality ReductionPrincipal Component AnalysisHybrid Fiber- Coaxial Network.AnomalidetekteringRotfelsanalysKlusteranalysk- meansSelf- Organizing MapGaussian Mixture ModelDimensionsreduceringPrincipal Component AnalysisHybrid Fiber Coax- nät.Computer and Information SciencesData- och informationsvetenskapFollowing the significant transition from the traditional production industry to an informationbased economy, the telecommunications industry was faced with an explosion of innovation, resulting in a continuous change in user behaviour. The industry has made efforts to adapt to a more datadriven future, which has given rise to larger and more complex systems. Therefore, troubleshooting systems such as anomaly detection and root cause analysis are essential features for maintaining service quality and facilitating daily operations. This study aims to explore the possibilities, benefits, and drawbacks of implementing cluster analysis for anomaly detection in hybrid fibercoaxial networks. Based on the literature review on unsupervised anomaly detection and an assumption regarding the anomalous behaviour in hybrid fibercoaxial network data, the kmeans, SelfOrganizing Map, and Gaussian Mixture Model were implemented both with and without Principal Component Analysis. Analysis of the results demonstrated an increase in performance for all models when the Principal Component Analysis was applied, with kmeans outperforming both SelfOrganizing Map and Gaussian Mixture Model. On this basis, it is recommended to apply Principal Component Analysis for clusteringbased anomaly detection. Further research is necessary to identify whether cluster analysis is the most appropriate unsupervised anomaly detection approach.  Följt av övergången från den traditionella tillverkningsindustrin till en informationsbaserad ekonomi stod telekommunikationsbranschen inför en explosion av innovation. Detta skifte resulterade i en kontinuerlig förändring av användarbeteende och branschen tvingades genomgå stora ansträngningar för att lyckas anpassa sig till den mer datadrivna framtiden. Större och mer komplexa system utvecklades och således blev felsökningsfunktioner såsom anomalidetektering och rotfelsanalys centrala för att upprätthålla servicekvalitet samt underlätta för den dagliga driftverksamheten. Syftet med studien är att utforska de möjligheterna, för- samt nackdelar med att använda klusteranalys för anomalidetektering inom HFC- nätverk. Baserat på litteraturstudien för oövervakad anomalidetektering samt antaganden för anomalibeteenden inom HFC- data valdes algritmerna k- means, Self- Organizing Map och Gaussian Mixture Model att implementeras, både med och utan Principal Component Analysis. Analys av resultaten påvisade en uppenbar ökning av prestanda för samtliga modeller vid användning av PCA. Vidare överträffade k- means, både Self- Organizing Maps och Gaussian Mixture Model. Utifrån resultatanalysen rekommenderas det således att PCA bör tillämpas vid klusterings- baserad anomalidetektering. Vidare är ytterligare forskning nödvändig för att avgöra huruvida klusteranalys är den mest lämpliga metoden för oövervakad anomalidetektering. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-305061TRITA-EECS-EX ; 2021:701application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Anomaly Detection
Root Cause Analysis
Cluster Analysis
k- means
Self- Organizing Map
Gaussian Mixture Model
Dimensionality Reduction
Principal Component Analysis
Hybrid Fiber- Coaxial Network.
Anomalidetektering
Rotfelsanalys
Klusteranalys
k- means
Self- Organizing Map
Gaussian Mixture Model
Dimensionsreducering
Principal Component Analysis
Hybrid Fiber Coax- nät.
Computer and Information Sciences
Data- och informationsvetenskap
spellingShingle Anomaly Detection
Root Cause Analysis
Cluster Analysis
k- means
Self- Organizing Map
Gaussian Mixture Model
Dimensionality Reduction
Principal Component Analysis
Hybrid Fiber- Coaxial Network.
Anomalidetektering
Rotfelsanalys
Klusteranalys
k- means
Self- Organizing Map
Gaussian Mixture Model
Dimensionsreducering
Principal Component Analysis
Hybrid Fiber Coax- nät.
Computer and Information Sciences
Data- och informationsvetenskap
Forsare Källman, Povel
Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach
description Following the significant transition from the traditional production industry to an informationbased economy, the telecommunications industry was faced with an explosion of innovation, resulting in a continuous change in user behaviour. The industry has made efforts to adapt to a more datadriven future, which has given rise to larger and more complex systems. Therefore, troubleshooting systems such as anomaly detection and root cause analysis are essential features for maintaining service quality and facilitating daily operations. This study aims to explore the possibilities, benefits, and drawbacks of implementing cluster analysis for anomaly detection in hybrid fibercoaxial networks. Based on the literature review on unsupervised anomaly detection and an assumption regarding the anomalous behaviour in hybrid fibercoaxial network data, the kmeans, SelfOrganizing Map, and Gaussian Mixture Model were implemented both with and without Principal Component Analysis. Analysis of the results demonstrated an increase in performance for all models when the Principal Component Analysis was applied, with kmeans outperforming both SelfOrganizing Map and Gaussian Mixture Model. On this basis, it is recommended to apply Principal Component Analysis for clusteringbased anomaly detection. Further research is necessary to identify whether cluster analysis is the most appropriate unsupervised anomaly detection approach.  === Följt av övergången från den traditionella tillverkningsindustrin till en informationsbaserad ekonomi stod telekommunikationsbranschen inför en explosion av innovation. Detta skifte resulterade i en kontinuerlig förändring av användarbeteende och branschen tvingades genomgå stora ansträngningar för att lyckas anpassa sig till den mer datadrivna framtiden. Större och mer komplexa system utvecklades och således blev felsökningsfunktioner såsom anomalidetektering och rotfelsanalys centrala för att upprätthålla servicekvalitet samt underlätta för den dagliga driftverksamheten. Syftet med studien är att utforska de möjligheterna, för- samt nackdelar med att använda klusteranalys för anomalidetektering inom HFC- nätverk. Baserat på litteraturstudien för oövervakad anomalidetektering samt antaganden för anomalibeteenden inom HFC- data valdes algritmerna k- means, Self- Organizing Map och Gaussian Mixture Model att implementeras, både med och utan Principal Component Analysis. Analys av resultaten påvisade en uppenbar ökning av prestanda för samtliga modeller vid användning av PCA. Vidare överträffade k- means, både Self- Organizing Maps och Gaussian Mixture Model. Utifrån resultatanalysen rekommenderas det således att PCA bör tillämpas vid klusterings- baserad anomalidetektering. Vidare är ytterligare forskning nödvändig för att avgöra huruvida klusteranalys är den mest lämpliga metoden för oövervakad anomalidetektering.
author Forsare Källman, Povel
author_facet Forsare Källman, Povel
author_sort Forsare Källman, Povel
title Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach
title_short Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach
title_full Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach
title_fullStr Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach
title_full_unstemmed Unsupervised Anomaly Detection and Root Cause Analysis in HFC Networks : A Clustering Approach
title_sort unsupervised anomaly detection and root cause analysis in hfc networks : a clustering approach
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2021
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-305061
work_keys_str_mv AT forsarekallmanpovel unsupervisedanomalydetectionandrootcauseanalysisinhfcnetworksaclusteringapproach
_version_ 1719495369975398400