Algorithms for XML stream processing : massive data, external memory and scalable performance

Plusieurs applications modernes nécessitent un traitement de flux massifs de données XML, cela crée de défis techniques. Parmi ces derniers, il y a la conception et la mise en ouvre d'outils pour optimiser le traitement des requêtes XPath et fournir une estimation précise des coûts de ces requê...

Full description

Bibliographic Details
Main Author: Alrammal, Muath
Language:English
Published: Université Paris-Est 2011
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00779309
http://tel.archives-ouvertes.fr/docs/00/77/93/09/PDF/TH2011PEST1002_complete.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00779309
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-007793092014-07-06T03:32:41Z http://tel.archives-ouvertes.fr/tel-00779309 2011PEST1002 http://tel.archives-ouvertes.fr/docs/00/77/93/09/PDF/TH2011PEST1002_complete.pdf Algorithms for XML stream processing : massive data, external memory and scalable performance Alrammal, Muath [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Traitement de flux Données XML Requêtes XPath Estimation de sélectivité Modèle de performance Optimisation de requêtes Plusieurs applications modernes nécessitent un traitement de flux massifs de données XML, cela crée de défis techniques. Parmi ces derniers, il y a la conception et la mise en ouvre d'outils pour optimiser le traitement des requêtes XPath et fournir une estimation précise des coûts de ces requêtes traitées sur un flux massif de données XML. Dans cette thèse, nous proposons un nouveau modèle de prédiction de performance qui estime a priori le coût (en termes d'espace utilisé et de temps écoulé) pour les requêtes structurelles de Forward XPath. Ce faisant, nous réalisons une étude expérimentale pour confirmer la relation linéaire entre le traitement de flux, et les ressources d'accès aux données. Par conséquent, nous présentons un modèle mathématique (fonctions de régression linéaire) pour prévoir le coût d'une requête XPath donnée. En outre, nous présentons une technique nouvelle d'estimation de sélectivité. Elle se compose de deux éléments. Le premier est le résumé path tree: une présentation concise et précise de la structure d'un document XML. Le second est l'algorithme d'estimation de sélectivité: un algorithme efficace de flux pour traverser le synopsis path tree pour estimer les valeurs des paramètres de coût. Ces paramètres sont utilisés par le modèle mathématique pour déterminer le coût d'une requête XPath donnée. Nous comparons les performances de notre modèle avec les approches existantes. De plus, nous présentons un cas d'utilisation d'un système en ligne appelé "online stream-querying system". Le système utilise notre modèle de prédiction de performance pour estimer le coût (en termes de temps / mémoire) d'une requête XPath donnée. En outre, il fournit une réponse précise à l'auteur de la requête. Ce cas d'utilisation illustre les avantages pratiques de gestion de performance avec nos techniques 2011-05-16 eng PhD thesis Université Paris-Est
collection NDLTD
language English
sources NDLTD
topic [INFO:INFO_OH] Computer Science/Other
[INFO:INFO_OH] Informatique/Autre
Traitement de flux
Données XML
Requêtes XPath
Estimation de sélectivité
Modèle de performance
Optimisation de requêtes
spellingShingle [INFO:INFO_OH] Computer Science/Other
[INFO:INFO_OH] Informatique/Autre
Traitement de flux
Données XML
Requêtes XPath
Estimation de sélectivité
Modèle de performance
Optimisation de requêtes
Alrammal, Muath
Algorithms for XML stream processing : massive data, external memory and scalable performance
description Plusieurs applications modernes nécessitent un traitement de flux massifs de données XML, cela crée de défis techniques. Parmi ces derniers, il y a la conception et la mise en ouvre d'outils pour optimiser le traitement des requêtes XPath et fournir une estimation précise des coûts de ces requêtes traitées sur un flux massif de données XML. Dans cette thèse, nous proposons un nouveau modèle de prédiction de performance qui estime a priori le coût (en termes d'espace utilisé et de temps écoulé) pour les requêtes structurelles de Forward XPath. Ce faisant, nous réalisons une étude expérimentale pour confirmer la relation linéaire entre le traitement de flux, et les ressources d'accès aux données. Par conséquent, nous présentons un modèle mathématique (fonctions de régression linéaire) pour prévoir le coût d'une requête XPath donnée. En outre, nous présentons une technique nouvelle d'estimation de sélectivité. Elle se compose de deux éléments. Le premier est le résumé path tree: une présentation concise et précise de la structure d'un document XML. Le second est l'algorithme d'estimation de sélectivité: un algorithme efficace de flux pour traverser le synopsis path tree pour estimer les valeurs des paramètres de coût. Ces paramètres sont utilisés par le modèle mathématique pour déterminer le coût d'une requête XPath donnée. Nous comparons les performances de notre modèle avec les approches existantes. De plus, nous présentons un cas d'utilisation d'un système en ligne appelé "online stream-querying system". Le système utilise notre modèle de prédiction de performance pour estimer le coût (en termes de temps / mémoire) d'une requête XPath donnée. En outre, il fournit une réponse précise à l'auteur de la requête. Ce cas d'utilisation illustre les avantages pratiques de gestion de performance avec nos techniques
author Alrammal, Muath
author_facet Alrammal, Muath
author_sort Alrammal, Muath
title Algorithms for XML stream processing : massive data, external memory and scalable performance
title_short Algorithms for XML stream processing : massive data, external memory and scalable performance
title_full Algorithms for XML stream processing : massive data, external memory and scalable performance
title_fullStr Algorithms for XML stream processing : massive data, external memory and scalable performance
title_full_unstemmed Algorithms for XML stream processing : massive data, external memory and scalable performance
title_sort algorithms for xml stream processing : massive data, external memory and scalable performance
publisher Université Paris-Est
publishDate 2011
url http://tel.archives-ouvertes.fr/tel-00779309
http://tel.archives-ouvertes.fr/docs/00/77/93/09/PDF/TH2011PEST1002_complete.pdf
work_keys_str_mv AT alrammalmuath algorithmsforxmlstreamprocessingmassivedataexternalmemoryandscalableperformance
_version_ 1716706657450328064