Combinação de modelos de previsão de séries temporais por meio de otimização multiobjetivo para alocação eficiente de recursos na nuvem

Em um ambiente de computação em nuvem, as empresas têm a capacidade de alocar recursos de acordo com a demanda. No entanto, há um atraso que pode levar alguns minutos entre o pedido de um novo recurso e o mesmo estar pronto para uso. Por esse motivo, as técnicas reativas, que solicitam um novo recur...

Full description

Bibliographic Details
Main Author: Messias, Valter Rogério
Other Authors: Estrella, Júlio Cezar
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2016
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-27012017-164522/
Description
Summary:Em um ambiente de computação em nuvem, as empresas têm a capacidade de alocar recursos de acordo com a demanda. No entanto, há um atraso que pode levar alguns minutos entre o pedido de um novo recurso e o mesmo estar pronto para uso. Por esse motivo, as técnicas reativas, que solicitam um novo recurso apenas quando o sistema atinge um determinado limiar de carga, não são adequadas para o processo de alocação de recursos. Para resolver esse problema, é necessário prever as requisições que chegam ao sistema, no próximo período de tempo, para alocar os recursos necessários antes que o sistema fique sobrecarregado. Existem vários modelos de previsão de séries temporais para calcular as previsões de carga de trabalho com base no histórico de dados de monitoramento. No entanto, é difícil saber qual é o melhor modelo de previsão a ser utilizado em cada caso. A tarefa se torna ainda mais complicada quando o usuário não tem muitos dados históricos a serem analisados. A maioria dos trabalhos relacionados, considera apenas modelos de previsão isolados para avaliar os resultados. Outros trabalhos propõem uma abordagem que seleciona modelos de previsão adequados para um determinado contexto. Mas, neste caso, é necessário ter uma quantidade significativa de dados para treinar o classificador. Além disso, a melhor solução pode não ser um modelo específico, mas sim uma combinação de modelos. Neste trabalho propomos um método de previsão adaptativo, usando técnicas de otimização multiobjetivo, para combinar modelos de previsão de séries temporais. O nosso método não requer uma fase prévia de treinamento, uma vez que se adapta constantemente a medida em que os dados chegam ao sistema. Para avaliar a nossa proposta usamos quatro logs extraídos de servidores reais. Os resultados mostram que a nossa proposta frequentemente converge para o melhor resultado, e é suficientemente genérica para se adaptar a diferentes tipos de séries temporais. === In a cloud computing environment, companies have the ability to allocate resources according to demand. However, there is a delay that may take minutes between the request for a new resource and it is ready for using. The reactive techniques, which request a new resource only when the system reaches a certain load threshold, are not suitable for the resource allocation process. To address this problem, it is necessary to predict requests that arrive at the system in the next period of time to allocate the necessary resources, before the system becomes overloaded. There are several time-series forecasting models to calculate the workload predictions based on history of monitoring data. However, it is difficult to know which is the best time series forecasting model to be used in each case. The work becomes even more complicated when the user does not have much historical data to be analyzed. Most related work considers only single methods to evaluate the results of the forecast. Other work propose an approach that selects suitable forecasting methods for a given context. But in this case, it is necessary to have a significant amount of data to train the classifier. Moreover, the best solution may not be a specific model, but rather a combination of models. In this work we propose an adaptive prediction method using multi-objective optimization techniques to combine time-series forecasting models. Our method does not require a previous phase of training, because it constantly adapts the extent to which the data is coming. To evaluate our proposal we use four logs extracted from real servers. The results show that our proposal often brings the best result, and is generic enough to adapt to various types of time series.