Towards Malleable Distributed Storage Systems˸ From Models to Practice

Le Cloud, avec son modèle économique, offre la possibilité d’un gestion élastique des ressources; les utilisateurs peuvent louer des ressources selon leurs besoins. Cette élasticité permet de réduire les coûts énergétiques et financiers, et aide les applications à s’adapter aux charges de travail va...

Full description

Bibliographic Details
Main Author: Cheriere, Nathanaël
Other Authors: Rennes, École normale supérieure
Language:en
Published: 2019
Subjects:
Online Access:http://www.theses.fr/2019ENSR0018/document
id ndltd-theses.fr-2019ENSR0018
record_format oai_dc
spelling ndltd-theses.fr-2019ENSR00182019-11-23T04:31:57Z Towards Malleable Distributed Storage Systems˸ From Models to Practice Malléabilité des Systèmes de Stockage Distribués ˸ Des Modèles à la Pratique Systèmes de Stockage Distribués Malléabilité Elasticité Modélisation Benchmark Distributed Storage Systems Malleability Elasticity Modeling Benchmarking Le Cloud, avec son modèle économique, offre la possibilité d’un gestion élastique des ressources; les utilisateurs peuvent louer des ressources selon leurs besoins. Cette élasticité permet de réduire les coûts énergétiques et financiers, et aide les applications à s’adapter aux charges de travail variables.Les applications manipulant de grandes quantités de données exécutées dans le Cloud ou sur des supercalculateurs sont souvent colocalisées avec un système de stockage distribué pour garantir un accès rapide aux données. Bien que de nombreux travaux aient été proposés pour redimensionner dynamiquement les capacités de calcul pour s’ajuster à la charge de travail, le stockage n’est pas considéré comme malléable (capable d’être redimensionné dynamiquement) puisque les transferts de grandes quantités de données nécessaires sont considérés trop lents. Cependant, le matériel et les techniques de stockage ont évolué et cette hypothèse doit être réévaluée.Dans cette thèse, nous présentons une étude sous différents angles des opérations de redimensionnement des systèmes de stockage distribués.Nous commençons par modéliser la durée minimale de ces opérations pour évaluer leur vitesse potentielle. Puis, nous développons un benchmark conçu pour mesurer la viabilité de la malléabilité d’un système de stockage sur une plateforme donnée. Finalement, nous implémentons un gestionnaire d’opérations de redimensionnement pour systèmes de stockage distribués qui décide et organise les transferts de données requis par ces opérations. The Cloud, with its pay-as-you-go model, gives the possibility of elastic resource management; users can claim and release resources as needed. This elasticity leads to financial and energetical cost reductions, and helps applications to cope with varying workloads.Distributed cloud and HPC applications processing large amounts of data are often co-located with a distributed storage system in order to ensure fast data accesses. Although many works have been proposed to dynamically rescale the processing part of such systems to match their workload, the storage is never considered as malleable (able to be dynamically rescaled) since moving massive amounts of data around is assumed to be too slow in practice. However, in recent years hardware and storage techniques have evolved and this assumption needs to be revisited.In this thesis, we present a study of the rescaling operations in distributed storage systems approached from different angles. We start by modeling the minimal duration of rescaling operations to estimate their potential speed. Then, we develop a benchmark to measure the viability of distributed storage system malleability on a given platform. Last, we implement a rescaling manager for distributed storage systems that decides and organizes the data transfers required during a rescaling operation. Electronic Thesis or Dissertation Text en http://www.theses.fr/2019ENSR0018/document Cheriere, Nathanaël 2019-11-05 Rennes, École normale supérieure Antoniu, Gabriel Dorier, Matthieu
collection NDLTD
language en
sources NDLTD
topic Systèmes de Stockage Distribués
Malléabilité
Elasticité
Modélisation
Benchmark
Distributed Storage Systems
Malleability
Elasticity
Modeling
Benchmarking

spellingShingle Systèmes de Stockage Distribués
Malléabilité
Elasticité
Modélisation
Benchmark
Distributed Storage Systems
Malleability
Elasticity
Modeling
Benchmarking

Cheriere, Nathanaël
Towards Malleable Distributed Storage Systems˸ From Models to Practice
description Le Cloud, avec son modèle économique, offre la possibilité d’un gestion élastique des ressources; les utilisateurs peuvent louer des ressources selon leurs besoins. Cette élasticité permet de réduire les coûts énergétiques et financiers, et aide les applications à s’adapter aux charges de travail variables.Les applications manipulant de grandes quantités de données exécutées dans le Cloud ou sur des supercalculateurs sont souvent colocalisées avec un système de stockage distribué pour garantir un accès rapide aux données. Bien que de nombreux travaux aient été proposés pour redimensionner dynamiquement les capacités de calcul pour s’ajuster à la charge de travail, le stockage n’est pas considéré comme malléable (capable d’être redimensionné dynamiquement) puisque les transferts de grandes quantités de données nécessaires sont considérés trop lents. Cependant, le matériel et les techniques de stockage ont évolué et cette hypothèse doit être réévaluée.Dans cette thèse, nous présentons une étude sous différents angles des opérations de redimensionnement des systèmes de stockage distribués.Nous commençons par modéliser la durée minimale de ces opérations pour évaluer leur vitesse potentielle. Puis, nous développons un benchmark conçu pour mesurer la viabilité de la malléabilité d’un système de stockage sur une plateforme donnée. Finalement, nous implémentons un gestionnaire d’opérations de redimensionnement pour systèmes de stockage distribués qui décide et organise les transferts de données requis par ces opérations. === The Cloud, with its pay-as-you-go model, gives the possibility of elastic resource management; users can claim and release resources as needed. This elasticity leads to financial and energetical cost reductions, and helps applications to cope with varying workloads.Distributed cloud and HPC applications processing large amounts of data are often co-located with a distributed storage system in order to ensure fast data accesses. Although many works have been proposed to dynamically rescale the processing part of such systems to match their workload, the storage is never considered as malleable (able to be dynamically rescaled) since moving massive amounts of data around is assumed to be too slow in practice. However, in recent years hardware and storage techniques have evolved and this assumption needs to be revisited.In this thesis, we present a study of the rescaling operations in distributed storage systems approached from different angles. We start by modeling the minimal duration of rescaling operations to estimate their potential speed. Then, we develop a benchmark to measure the viability of distributed storage system malleability on a given platform. Last, we implement a rescaling manager for distributed storage systems that decides and organizes the data transfers required during a rescaling operation.
author2 Rennes, École normale supérieure
author_facet Rennes, École normale supérieure
Cheriere, Nathanaël
author Cheriere, Nathanaël
author_sort Cheriere, Nathanaël
title Towards Malleable Distributed Storage Systems˸ From Models to Practice
title_short Towards Malleable Distributed Storage Systems˸ From Models to Practice
title_full Towards Malleable Distributed Storage Systems˸ From Models to Practice
title_fullStr Towards Malleable Distributed Storage Systems˸ From Models to Practice
title_full_unstemmed Towards Malleable Distributed Storage Systems˸ From Models to Practice
title_sort towards malleable distributed storage systems˸ from models to practice
publishDate 2019
url http://www.theses.fr/2019ENSR0018/document
work_keys_str_mv AT cherierenathanael towardsmalleabledistributedstoragesystemsfrommodelstopractice
AT cherierenathanael malleabilitedessystemesdestockagedistribuesdesmodelesalapratique
_version_ 1719295626176364544