Intégration holistique et entreposage automatique des données ouvertes

Les statistiques présentes dans les Open Data ou données ouvertes constituent des informations utiles pour alimenter un système décisionnel. Leur intégration et leur entreposage au sein du système décisionnel se fait à travers des processus ETL. Il faut automatiser ces processus afin de faciliter le...

Full description

Bibliographic Details
Main Author: Megdiche Bousarsar, Imen
Other Authors: Toulouse 3
Language:fr
Published: 2015
Subjects:
ETL
Online Access:http://www.theses.fr/2015TOU30214/document
id ndltd-theses.fr-2015TOU30214
record_format oai_dc
spelling ndltd-theses.fr-2015TOU302142019-05-25T03:33:17Z Intégration holistique et entreposage automatique des données ouvertes Holistic integration and automatic warehousing of open data Données ouvertes ETL Graphes Détection tableaux Intégration holistique Entrepôt de données Open data ETL Graphs Table detection Holistic integration Data warehouses Les statistiques présentes dans les Open Data ou données ouvertes constituent des informations utiles pour alimenter un système décisionnel. Leur intégration et leur entreposage au sein du système décisionnel se fait à travers des processus ETL. Il faut automatiser ces processus afin de faciliter leur accessibilité à des non-experts. Ces processus doivent pallier aux problèmes de manque de schémas, d'hétérogénéité structurelle et sémantique qui caractérisent les données ouvertes. Afin de répondre à ces problématiques, nous proposons une nouvelle démarche ETL basée sur les graphes. Pour l'extraction du graphe d'un tableau, nous proposons des activités de détection et d'annotation automatiques. Pour la transformation, nous proposons un programme linéaire pour résoudre le problème d'appariement holistique de données structurelles provenant de plusieurs graphes. Ce modèle fournit une solution optimale et unique. Pour le chargement, nous proposons un processus progressif pour la définition du schéma multidimensionnel et l'augmentation du graphe intégré. Enfin, nous présentons un prototype et les résultats d'expérimentations. Statistical Open Data present useful information to feed up a decision-making system. Their integration and storage within these systems is achieved through ETL processes. It is necessary to automate these processes in order to facilitate their accessibility to non-experts. These processes have also need to face out the problems of lack of schemes and structural and sematic heterogeneity, which characterize the Open Data. To meet these issues, we propose a new ETL approach based on graphs. For the extraction, we propose automatic activities performing detection and annotations based on a model of a table. For the transformation, we propose a linear program fulfilling holistic integration of several graphs. This model supplies an optimal and a unique solution. For the loading, we propose a progressive process for the definition of the multidimensional schema and the augmentation of the integrated graph. Finally, we present a prototype and the experimental evaluations. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2015TOU30214/document Megdiche Bousarsar, Imen 2015-12-10 Toulouse 3 Teste, Olivier Berro, Alain
collection NDLTD
language fr
sources NDLTD
topic Données ouvertes
ETL
Graphes
Détection tableaux
Intégration holistique
Entrepôt de données
Open data
ETL
Graphs
Table detection
Holistic integration
Data warehouses

spellingShingle Données ouvertes
ETL
Graphes
Détection tableaux
Intégration holistique
Entrepôt de données
Open data
ETL
Graphs
Table detection
Holistic integration
Data warehouses

Megdiche Bousarsar, Imen
Intégration holistique et entreposage automatique des données ouvertes
description Les statistiques présentes dans les Open Data ou données ouvertes constituent des informations utiles pour alimenter un système décisionnel. Leur intégration et leur entreposage au sein du système décisionnel se fait à travers des processus ETL. Il faut automatiser ces processus afin de faciliter leur accessibilité à des non-experts. Ces processus doivent pallier aux problèmes de manque de schémas, d'hétérogénéité structurelle et sémantique qui caractérisent les données ouvertes. Afin de répondre à ces problématiques, nous proposons une nouvelle démarche ETL basée sur les graphes. Pour l'extraction du graphe d'un tableau, nous proposons des activités de détection et d'annotation automatiques. Pour la transformation, nous proposons un programme linéaire pour résoudre le problème d'appariement holistique de données structurelles provenant de plusieurs graphes. Ce modèle fournit une solution optimale et unique. Pour le chargement, nous proposons un processus progressif pour la définition du schéma multidimensionnel et l'augmentation du graphe intégré. Enfin, nous présentons un prototype et les résultats d'expérimentations. === Statistical Open Data present useful information to feed up a decision-making system. Their integration and storage within these systems is achieved through ETL processes. It is necessary to automate these processes in order to facilitate their accessibility to non-experts. These processes have also need to face out the problems of lack of schemes and structural and sematic heterogeneity, which characterize the Open Data. To meet these issues, we propose a new ETL approach based on graphs. For the extraction, we propose automatic activities performing detection and annotations based on a model of a table. For the transformation, we propose a linear program fulfilling holistic integration of several graphs. This model supplies an optimal and a unique solution. For the loading, we propose a progressive process for the definition of the multidimensional schema and the augmentation of the integrated graph. Finally, we present a prototype and the experimental evaluations.
author2 Toulouse 3
author_facet Toulouse 3
Megdiche Bousarsar, Imen
author Megdiche Bousarsar, Imen
author_sort Megdiche Bousarsar, Imen
title Intégration holistique et entreposage automatique des données ouvertes
title_short Intégration holistique et entreposage automatique des données ouvertes
title_full Intégration holistique et entreposage automatique des données ouvertes
title_fullStr Intégration holistique et entreposage automatique des données ouvertes
title_full_unstemmed Intégration holistique et entreposage automatique des données ouvertes
title_sort intégration holistique et entreposage automatique des données ouvertes
publishDate 2015
url http://www.theses.fr/2015TOU30214/document
work_keys_str_mv AT megdichebousarsarimen integrationholistiqueetentreposageautomatiquedesdonneesouvertes
AT megdichebousarsarimen holisticintegrationandautomaticwarehousingofopendata
_version_ 1719192564972650496