Anomaly detection in streaming multivariate time series

Doctor en Ciencias, Mención Computación === Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte de la serie original) como entrada, uno quiere conocer si este corresponde...

Full description

Bibliographic Details
Main Author: Sánchez Enríquez, Heider Ysaías
Other Authors: Bustos Cárdenas, Benjamín
Language:en
Published: Universidad de Chile 2018
Subjects:
Online Access:http://repositorio.uchile.cl/handle/2250/149078
id ndltd-UCHILE-oai-repositorio.uchile.cl-2250-149078
record_format oai_dc
spelling ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1490782018-11-05T05:37:45Z Anomaly detection in streaming multivariate time series Sánchez Enríquez, Heider Ysaías Bustos Cárdenas, Benjamín Barceló Baeza, Pablo Gutiérrez Gallardo, Claudio Gravier, Guillaume Análisis multivariado Búsqueda por similitud Detección de anomalías Discord discovery Doctor en Ciencias, Mención Computación Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte de la serie original) como entrada, uno quiere conocer si este corresponde a una observación normal o es una anomalı́a, con respecto a la información histórica. Pueden surgir dificultades debido principalmente a que los tipos de anomalı́a son desconocidos. Además, la detección se convierte en una tarea costosa debido a la gran cantidad de datos y a la existencia de variables de dominios heterogéneos. En este contexto, se propone un enfoque de detección de anomalı́as basado en Discord Discovery, que asocia la anomalı́a con la subsecuencia más inusual utilizando medidas de similitud. Tı́picamente, los métodos de reducción de la dimensionalidad y de indexación son elaborados para restringir el problema resolviéndolo eficientemente. Adicionalmente, se propone técnicas para generar modelos representativos y consisos a partir de los datos crudos con el fin de encontrar los patrones inusuales. Estas técnicas también mejoran la eficiencia en la búsqueda mediante la reducción de la dimensionalidad. Se aborda las series multivariantes usando técnicas de representación sobre subsequencias no- normalizadas, y se propone nuevas técnicas de discord discovery basados en ı́ndices métricos. El enfoque propuesto es comparado con técnicas del estado del arte. Los resultados ex- perimentales demuestran que aplicando la transformación de translación y representación de series temporales pueden contribuir a mejorar la eficacia en la detección. Además, los métodos de indexación métrica y las heurı́sticas de discord discovery pueden resolver eficien- temente la detección de anomalı́as en modo offline y online en flujos de series temporales multivariantes. Este trabajo ha sido financiado por beca CONICYT - CHILE / Doctorado para Extranjeros, y apoyada parcialmente por el Proyecto FONDEF D09I1185 y el Programa de Becas de NIC Chile 2018-06-20T18:25:48Z 2018-06-20T18:25:48Z 2017 Tesis http://repositorio.uchile.cl/handle/2250/149078 en Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile
collection NDLTD
language en
sources NDLTD
topic Análisis multivariado
Búsqueda por similitud
Detección de anomalías
Discord discovery
spellingShingle Análisis multivariado
Búsqueda por similitud
Detección de anomalías
Discord discovery
Sánchez Enríquez, Heider Ysaías
Anomaly detection in streaming multivariate time series
description Doctor en Ciencias, Mención Computación === Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte de la serie original) como entrada, uno quiere conocer si este corresponde a una observación normal o es una anomalı́a, con respecto a la información histórica. Pueden surgir dificultades debido principalmente a que los tipos de anomalı́a son desconocidos. Además, la detección se convierte en una tarea costosa debido a la gran cantidad de datos y a la existencia de variables de dominios heterogéneos. En este contexto, se propone un enfoque de detección de anomalı́as basado en Discord Discovery, que asocia la anomalı́a con la subsecuencia más inusual utilizando medidas de similitud. Tı́picamente, los métodos de reducción de la dimensionalidad y de indexación son elaborados para restringir el problema resolviéndolo eficientemente. Adicionalmente, se propone técnicas para generar modelos representativos y consisos a partir de los datos crudos con el fin de encontrar los patrones inusuales. Estas técnicas también mejoran la eficiencia en la búsqueda mediante la reducción de la dimensionalidad. Se aborda las series multivariantes usando técnicas de representación sobre subsequencias no- normalizadas, y se propone nuevas técnicas de discord discovery basados en ı́ndices métricos. El enfoque propuesto es comparado con técnicas del estado del arte. Los resultados ex- perimentales demuestran que aplicando la transformación de translación y representación de series temporales pueden contribuir a mejorar la eficacia en la detección. Además, los métodos de indexación métrica y las heurı́sticas de discord discovery pueden resolver eficien- temente la detección de anomalı́as en modo offline y online en flujos de series temporales multivariantes. === Este trabajo ha sido financiado por beca CONICYT - CHILE / Doctorado para Extranjeros, y apoyada parcialmente por el Proyecto FONDEF D09I1185 y el Programa de Becas de NIC Chile
author2 Bustos Cárdenas, Benjamín
author_facet Bustos Cárdenas, Benjamín
Sánchez Enríquez, Heider Ysaías
author Sánchez Enríquez, Heider Ysaías
author_sort Sánchez Enríquez, Heider Ysaías
title Anomaly detection in streaming multivariate time series
title_short Anomaly detection in streaming multivariate time series
title_full Anomaly detection in streaming multivariate time series
title_fullStr Anomaly detection in streaming multivariate time series
title_full_unstemmed Anomaly detection in streaming multivariate time series
title_sort anomaly detection in streaming multivariate time series
publisher Universidad de Chile
publishDate 2018
url http://repositorio.uchile.cl/handle/2250/149078
work_keys_str_mv AT sanchezenriquezheiderysaias anomalydetectioninstreamingmultivariatetimeseries
_version_ 1718788410953433088