OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques

Le besoin d'expliciter la sémantique des données dans différents domaines scientifiques (biologie, médecine, géographie, ingénierie, etc.) s'est traduit par la définition de données faisant référence à des ontologies, encore appelées données à base ontologique. Avec la multiplication des o...

Full description

Bibliographic Details
Main Author: Fankam, Chimène
Language:FRE
Published: 2009
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00452533
http://tel.archives-ouvertes.fr/docs/00/45/25/33/PDF/These_Fankam_Chimene.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00452533
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-004525332013-01-07T18:11:44Z http://tel.archives-ouvertes.fr/tel-00452533 http://tel.archives-ouvertes.fr/docs/00/45/25/33/PDF/These_Fankam_Chimene.pdf OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques Fankam, Chimène [INFO] Computer Science Ontologies (informatique) Bases de données--Interrogation Bases de données--Gestion Web sémantique Le besoin d'expliciter la sémantique des données dans différents domaines scientifiques (biologie, médecine, géographie, ingénierie, etc.) s'est traduit par la définition de données faisant référence à des ontologies, encore appelées données à base ontologique. Avec la multiplication des ontologies de domaine, et le volume important de données à manipuler, est apparu le besoin de systèmes susceptibles de gérer des données à base ontologique de grande taille. De tels systèmes sont appelés des systèmes de gestion de Bases de Données à Base Ontologique (BDBO). Les principales limitations des systèmes de gestion de BDBO existants sont (1) leur rigidité, due à la prise en compte des constructions d'un unique formalisme d'expression d'ontologies, (2) l'absence de support pour les données non standard (spatiales, temporelles, etc.) et, (3) leur manque d'efficacité pour gérer efficacement les données de grande taille. Nous proposons dans cette thèse un nouveau système de gestion de BDBO permettant (1) de supporter des ontologies basées sur différents formalismes d'ontologies, (2) l'extension de son formalisme d'ontologie pour répondre aux besoins spécifiques des applications, et (3) une gestion originale des données facilitant le passage à grande échelle. Le système que nous proposons dans cette thèse, ontodb2, se fonde sur l'existence d'un ensemble de constructions communes aux différents formalismes d'expression d'ontologies, susceptible de constituer une ontologie noyau, et sur les techniques de gestion des modèles pour permettre l'extension flexible de ce noyau. Nous proposons également une approche originale de gestion des données à base ontologique. Cette approche part du fait que les données à base ontologique peuvent se classifier en données canoniques (instances de classes primitives) et noncanoniques (instances de classes définies). Les instances de classes définies peuvent, sous certaines hypothèses, s'exprimer en termes d'instances de classes primitives. Nous proposons donc de ne représenter que les données canoniques, en transformant sous certaines conditions, toute donnée non-canonique en donnée canonique. Enfin, nous proposons d'exploiter l'interpréteur de requêtes ontologiques pour permettre (1) l'accès aux données non-canoniques ainsi transformées et, (2) d'indexer et pré-calculer les raisonnements en se basant sur les mécanismes du SGBD support. L'ensemble de ces propositions est validé (1) à travers une implémentation sur le SGBD PostgreSQL basée sur les formalismes d'ontologies PLIB, RDFS et OWL Lite, (2) des tests de performances sur des ensembles de données issus de la géographie et du Web. 2009-12-10 FRE PhD thesis
collection NDLTD
language FRE
sources NDLTD
topic [INFO] Computer Science
Ontologies (informatique)
Bases de données--Interrogation
Bases de données--Gestion
Web sémantique
spellingShingle [INFO] Computer Science
Ontologies (informatique)
Bases de données--Interrogation
Bases de données--Gestion
Web sémantique
Fankam, Chimène
OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
description Le besoin d'expliciter la sémantique des données dans différents domaines scientifiques (biologie, médecine, géographie, ingénierie, etc.) s'est traduit par la définition de données faisant référence à des ontologies, encore appelées données à base ontologique. Avec la multiplication des ontologies de domaine, et le volume important de données à manipuler, est apparu le besoin de systèmes susceptibles de gérer des données à base ontologique de grande taille. De tels systèmes sont appelés des systèmes de gestion de Bases de Données à Base Ontologique (BDBO). Les principales limitations des systèmes de gestion de BDBO existants sont (1) leur rigidité, due à la prise en compte des constructions d'un unique formalisme d'expression d'ontologies, (2) l'absence de support pour les données non standard (spatiales, temporelles, etc.) et, (3) leur manque d'efficacité pour gérer efficacement les données de grande taille. Nous proposons dans cette thèse un nouveau système de gestion de BDBO permettant (1) de supporter des ontologies basées sur différents formalismes d'ontologies, (2) l'extension de son formalisme d'ontologie pour répondre aux besoins spécifiques des applications, et (3) une gestion originale des données facilitant le passage à grande échelle. Le système que nous proposons dans cette thèse, ontodb2, se fonde sur l'existence d'un ensemble de constructions communes aux différents formalismes d'expression d'ontologies, susceptible de constituer une ontologie noyau, et sur les techniques de gestion des modèles pour permettre l'extension flexible de ce noyau. Nous proposons également une approche originale de gestion des données à base ontologique. Cette approche part du fait que les données à base ontologique peuvent se classifier en données canoniques (instances de classes primitives) et noncanoniques (instances de classes définies). Les instances de classes définies peuvent, sous certaines hypothèses, s'exprimer en termes d'instances de classes primitives. Nous proposons donc de ne représenter que les données canoniques, en transformant sous certaines conditions, toute donnée non-canonique en donnée canonique. Enfin, nous proposons d'exploiter l'interpréteur de requêtes ontologiques pour permettre (1) l'accès aux données non-canoniques ainsi transformées et, (2) d'indexer et pré-calculer les raisonnements en se basant sur les mécanismes du SGBD support. L'ensemble de ces propositions est validé (1) à travers une implémentation sur le SGBD PostgreSQL basée sur les formalismes d'ontologies PLIB, RDFS et OWL Lite, (2) des tests de performances sur des ensembles de données issus de la géographie et du Web.
author Fankam, Chimène
author_facet Fankam, Chimène
author_sort Fankam, Chimène
title OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
title_short OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
title_full OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
title_fullStr OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
title_full_unstemmed OntoDB2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
title_sort ontodb2 : un système flexible et efficient de base de données à base ontologique pour le web sémantique et les données techniques
publishDate 2009
url http://tel.archives-ouvertes.fr/tel-00452533
http://tel.archives-ouvertes.fr/docs/00/45/25/33/PDF/These_Fankam_Chimene.pdf
work_keys_str_mv AT fankamchimene ontodb2unsystemeflexibleetefficientdebasededonneesabaseontologiquepourlewebsemantiqueetlesdonneestechniques
_version_ 1716398143814238208