Adaptive Remus: replicação de máquinas virtuais Xen com checkpointing adaptável

Made available in DSpace on 2016-12-12T20:22:53Z (GMT). No. of bitstreams: 1 Marcelo Pereira da Silva.pdf: 1790996 bytes, checksum: 8b61245ad63935d86a70520f22eae9bc (MD5) Previous issue date: 2015-07-03 === Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === With the ever-increasing de...

Full description

Bibliographic Details
Main Author: Silva, Marcelo Pereira da
Other Authors: Koslovski, Guilherme Piêgas
Format: Others
Language:Portuguese
Published: Universidade do Estado de Santa Catarina 2016
Subjects:
Xen
MV
VM
Online Access:http://tede.udesc.br/handle/handle/2046
Description
Summary:Made available in DSpace on 2016-12-12T20:22:53Z (GMT). No. of bitstreams: 1 Marcelo Pereira da Silva.pdf: 1790996 bytes, checksum: 8b61245ad63935d86a70520f22eae9bc (MD5) Previous issue date: 2015-07-03 === Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === With the ever-increasing dependence on computers and networks, many systems are required to be continuously available in order to fulfill their mission. Virtualization technology enables high availability to be offered in a convenient, cost-effective manner: with the encapsulation provided by virtual machines (VMs), entire systems can be replicated transparently in software, obviating the need for expensive fault-tolerant hardware. Remus is a VM replication mechanism for the Xen hypervisor that provides high availability despite crash failures. Replication is performed by checkpointing the VM at fixed intervals. However, there is an antagonism between processing and communication regarding the optimal checkpointing interval: while longer intervals benefit processorintensive applications, shorter intervals favor network-intensive applications. Thus, any chosen interval may not always be suitable for the hosted applications, limiting Remus usage in many scenarios. This work introduces Adaptive Remus, a proposal for adaptive checkpointing in Remus that dynamically adjusts the replication frequency according to the characteristics of running applications. Experimental results indicate that our proposal improves performance for applications that require both processing and communication, without harming applications that use only one type of resource. === Com a dependência cada vez maior de computadores e redes, muitos sistemas precisam estar continuamente disponíveis para cumprir sua missão. A tecnologia de virtualização permite prover alta disponibilidade de forma conveniente e a um custo razoável: com o encapsulamento oferecido pelas máquinas virtuais (MVs), sistemas inteiros podem ser replicados em software, de forma transparente, eliminando a necessidade de hardware tolerante a faltas dispendioso. Remus é um mecanismo de replicação de MVs que fornece alta disponibilidade diante de faltas de parada. A replicação é realizada através de checkpointing, seguindo um intervalo fixo de tempo predeterminado. Todavia, existe um antagonismo entre processamento e comunicação em relação ao intervalo ideal entre checkpoints: enquanto intervalos maiores beneficiam aplicações com processamento intensivo, intervalos menores favorecem as aplicações cujo desempenho é dominado pela rede. Logo, o intervalo utilizado nem sempre é o adequado para as características de uso de recursos da aplicação em execução na MV, limitando a aplicabilidade de Remus em determinados cenários. Este trabalho apresenta Adaptive Remus, uma proposta de checkpointing adaptativo para Remus, que ajusta dinamicamente a frequência de replicação de acordo com as características das aplicações em execução. Os resultados indicam que a proposta obtém um melhor desempenho de aplicações que utilizam tanto recursos de processamento como de comunicação, sem prejudicar aplicações que usam apenas um dos tipos de recursos.