Um algoritmo de clusterização de dados para auxílio à analise de comportamentos de sistemas

Os sistemas atuais se caracterizam pela variedade de incertezas humanas, ambientais e sistêmicas que afetam os comportamentos deles, influindo nos modos normais de operação e fazendo com que estes se comportem de modos anômalos ou até de modos falhos. Como isto é inevitável, é mandatória a detecção...

Full description

Bibliographic Details
Main Author: Lorena Gayarre Peña
Other Authors: Marcelo Lopes de Oliveira e Souza
Language:Portuguese
Published: Instituto Nacional de Pesquisas Espaciais (INPE) 2015
Online Access:http://urlib.net/sid.inpe.br/mtc-m21b/2015/04.23.19.03
Description
Summary:Os sistemas atuais se caracterizam pela variedade de incertezas humanas, ambientais e sistêmicas que afetam os comportamentos deles, influindo nos modos normais de operação e fazendo com que estes se comportem de modos anômalos ou até de modos falhos. Como isto é inevitável, é mandatória a detecção de anomalias e a análise de comportamentos no projeto de sistemas altamente confiáveis como nas áreas espacial ou aeronáutica. Motivados por esta necessidade, o objetivo deste trabalho é propor, implementar e testar um algoritmo de clusterização de dados para auxílio à análise de comportamentos de sistemas.. Neste trabalho procura-se que o algoritmo desenvolvido seja de aplicação genérica, i.e., não se precise ter conhecimento prévio do sistema a ser estudado. Para isso, primeiro é feita uma apresentação dos métodos baseados em dados e dos métodos baseados em modelos para identificação de comportamentos, explicando por que foram escolhidos os métodos baseados em dados. Depois são apresentados os métodos baseados em dados que são utilizados no desenvolvimento do algoritmo, a saber, métodos de clusterização, métodos matemáticos, métodos estatísticos e métodos de filtragem. Fazendo uso dessas técnicas, é desenvolvido o algoritmo de análise de comportamentos, chamado de BAbyLO-BR. Em seguida, o algoritmo é validado utilizando quatro estudos de caso de diferentes características e áreas de aplicação. Esta diversidade de estudos de caso permite ilustrar a generalidade de aplicação do algoritmo. Por último, um estudo que enumera as vantagens e desvantagens de aplicação deste novo algoritmo é realizado. === Current systems are characterized by the variety of human, environmental and system uncertainties which affect the normal operation of the system, causing anomalous or even failed behavior. This situation is not avoidable, so anomaly detection and behavioral analysis of the component or system is needed and even mandatory, especially in high reliability systems such as those from the space and aeronautical industry. Under this motivation, the aim of this thesis is to propose, implement and test a data clustering algorithm to assist in system behavioural analysis.. In this work, the algorithm is intended to be of general application, i.e., it will not require previous knowledge of the system under study. To do this, first a theoretical comparison between data based methods and model based methods is done, explaining why data based methods are chosen. Later, the used data based methods are presented: clustering methods, mathematical methods, statistical methods, and filtering methods. By using these methods, a behavioral analysis algorithm is developed; it is called BAbyLO-BR algorithm. Then, the algorithm is validated by its application to four study cases with diverse characteristics and belonging to different areas of research. This diversity allows ilustrating the general application of the algorithm. Finally, a study enumerating the vantages and disadvantages of using the algorithm for anomaly detection and behavioral analysis is conducted.