Anomaly detection in streaming multivariate time series
Doctor en Ciencias, Mención Computación === Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte de la serie original) como entrada, uno quiere conocer si este corresponde...
Main Author: | |
---|---|
Other Authors: | |
Language: | en |
Published: |
Universidad de Chile
2018
|
Subjects: | |
Online Access: | http://repositorio.uchile.cl/handle/2250/149078 |
id |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-149078 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UCHILE-oai-repositorio.uchile.cl-2250-1490782018-11-05T05:37:45Z Anomaly detection in streaming multivariate time series Sánchez Enríquez, Heider Ysaías Bustos Cárdenas, Benjamín Barceló Baeza, Pablo Gutiérrez Gallardo, Claudio Gravier, Guillaume Análisis multivariado Búsqueda por similitud Detección de anomalías Discord discovery Doctor en Ciencias, Mención Computación Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte de la serie original) como entrada, uno quiere conocer si este corresponde a una observación normal o es una anomalı́a, con respecto a la información histórica. Pueden surgir dificultades debido principalmente a que los tipos de anomalı́a son desconocidos. Además, la detección se convierte en una tarea costosa debido a la gran cantidad de datos y a la existencia de variables de dominios heterogéneos. En este contexto, se propone un enfoque de detección de anomalı́as basado en Discord Discovery, que asocia la anomalı́a con la subsecuencia más inusual utilizando medidas de similitud. Tı́picamente, los métodos de reducción de la dimensionalidad y de indexación son elaborados para restringir el problema resolviéndolo eficientemente. Adicionalmente, se propone técnicas para generar modelos representativos y consisos a partir de los datos crudos con el fin de encontrar los patrones inusuales. Estas técnicas también mejoran la eficiencia en la búsqueda mediante la reducción de la dimensionalidad. Se aborda las series multivariantes usando técnicas de representación sobre subsequencias no- normalizadas, y se propone nuevas técnicas de discord discovery basados en ı́ndices métricos. El enfoque propuesto es comparado con técnicas del estado del arte. Los resultados ex- perimentales demuestran que aplicando la transformación de translación y representación de series temporales pueden contribuir a mejorar la eficacia en la detección. Además, los métodos de indexación métrica y las heurı́sticas de discord discovery pueden resolver eficien- temente la detección de anomalı́as en modo offline y online en flujos de series temporales multivariantes. Este trabajo ha sido financiado por beca CONICYT - CHILE / Doctorado para Extranjeros, y apoyada parcialmente por el Proyecto FONDEF D09I1185 y el Programa de Becas de NIC Chile 2018-06-20T18:25:48Z 2018-06-20T18:25:48Z 2017 Tesis http://repositorio.uchile.cl/handle/2250/149078 en Attribution-NonCommercial-NoDerivs 3.0 Chile http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ Universidad de Chile |
collection |
NDLTD |
language |
en |
sources |
NDLTD |
topic |
Análisis multivariado Búsqueda por similitud Detección de anomalías Discord discovery |
spellingShingle |
Análisis multivariado Búsqueda por similitud Detección de anomalías Discord discovery Sánchez Enríquez, Heider Ysaías Anomaly detection in streaming multivariate time series |
description |
Doctor en Ciencias, Mención Computación === Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en
flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte
de la serie original) como entrada, uno quiere conocer si este corresponde a una observación
normal o es una anomalı́a, con respecto a la información histórica. Pueden surgir dificultades
debido principalmente a que los tipos de anomalı́a son desconocidos. Además, la detección
se convierte en una tarea costosa debido a la gran cantidad de datos y a la existencia de
variables de dominios heterogéneos. En este contexto, se propone un enfoque de detección
de anomalı́as basado en Discord Discovery, que asocia la anomalı́a con la subsecuencia
más inusual utilizando medidas de similitud. Tı́picamente, los métodos de reducción de la
dimensionalidad y de indexación son elaborados para restringir el problema resolviéndolo
eficientemente.
Adicionalmente, se propone técnicas para generar modelos representativos y consisos a
partir de los datos crudos con el fin de encontrar los patrones inusuales. Estas técnicas
también mejoran la eficiencia en la búsqueda mediante la reducción de la dimensionalidad.
Se aborda las series multivariantes usando técnicas de representación sobre subsequencias no-
normalizadas, y se propone nuevas técnicas de discord discovery basados en ı́ndices métricos.
El enfoque propuesto es comparado con técnicas del estado del arte. Los resultados ex-
perimentales demuestran que aplicando la transformación de translación y representación
de series temporales pueden contribuir a mejorar la eficacia en la detección. Además, los
métodos de indexación métrica y las heurı́sticas de discord discovery pueden resolver eficien-
temente la detección de anomalı́as en modo offline y online en flujos de series temporales
multivariantes. === Este trabajo ha sido financiado por beca CONICYT - CHILE / Doctorado para Extranjeros, y apoyada parcialmente por el Proyecto FONDEF D09I1185 y el Programa de Becas de NIC Chile |
author2 |
Bustos Cárdenas, Benjamín |
author_facet |
Bustos Cárdenas, Benjamín Sánchez Enríquez, Heider Ysaías |
author |
Sánchez Enríquez, Heider Ysaías |
author_sort |
Sánchez Enríquez, Heider Ysaías |
title |
Anomaly detection in streaming multivariate time series |
title_short |
Anomaly detection in streaming multivariate time series |
title_full |
Anomaly detection in streaming multivariate time series |
title_fullStr |
Anomaly detection in streaming multivariate time series |
title_full_unstemmed |
Anomaly detection in streaming multivariate time series |
title_sort |
anomaly detection in streaming multivariate time series |
publisher |
Universidad de Chile |
publishDate |
2018 |
url |
http://repositorio.uchile.cl/handle/2250/149078 |
work_keys_str_mv |
AT sanchezenriquezheiderysaias anomalydetectioninstreamingmultivariatetimeseries |
_version_ |
1718788410953433088 |