Annotation sémantique floue de tableaux guidée par une ontologie
Nous pr´esentons dans ce m´emoire une m´ethode d'annotation de tableaux guid´ee par les connaissances d'un domaine d'application formalis´ees dans une on- tologie. Apr`es avoir pr´esent´e le contexte applicatif et une ´etude bibliographique sur l'annotation s´emantique et l'...
Main Author: | |
---|---|
Published: |
AgroParisTech
2007
|
Subjects: | |
Online Access: | http://pastel.archives-ouvertes.fr/pastel-00003799 http://pastel.archives-ouvertes.fr/docs/00/50/08/53/PDF/rapportThese.pdf |
Summary: | Nous pr´esentons dans ce m´emoire une m´ethode d'annotation de tableaux guid´ee par les connaissances d'un domaine d'application formalis´ees dans une on- tologie. Apr`es avoir pr´esent´e le contexte applicatif et une ´etude bibliographique sur l'annotation s´emantique et l'extraction d'information, nous pr´esentons les diff´erentes ´etapes de notre syst`eme : annotation des cellules, des colonnes puis des relations repr´esent´ees par le tableau. Nous traitons diff´eremment les donn´ees selon qu'elles sont num´eriques ou symboliques. Nous commen¸cons par d´eterminer si une colonne d'un tableau contient des donn´ees num´eriques ou symboliques. Les donn´ees symboliques sont annot´ees avec les termes de l'ontologie, en utilisant une comparaison mot `a mot des termes employ´es dans le tableau avec ceux d´efinis dans l'ontologie. Les donn´ees num´eriques sont extraites, ainsi que les unit´es de mesure employ´ees, et compar´ees avec les unit´es et intervalles de valeurs possibles d´efinis dans l'ontologie pour les types de donn´ees num´eriques. Le type de donn´ees repr´esent´e par chaque colonne du tableau est alors d´etermin´e, en utilisant `a la fois le contenu de la colonne (deux m´ethodes diff´erentes sont employ´ees suivant que la colonne contient des donn´ees num´eriques ou symboliques) et le titre de la colonne. Une fois le type des colonnes reconnu, les relations s´emantiques repr´esent´ees par le tableau sont identifi´ees en utilisant `a la fois le titre du tableau et la signature du tableau, qui est compar´ee avec la signature des relations s´emantiques d´efinies dans l'ontologie. Les relations reconnues sont ensuite instanci´ees pour chaque ligne du tableau. Les annotations que nous manipulons sont floues, c'est-`a-dire qu'au lieu de faire un lien direct entre un ´el´ement du tableau et un ´el´ement de l'ontologie, nous proposons plusieurs valeurs possibles pour l'annotation, en as- sociant `a chaque valeur un degr´e repr´esentant la confiance que l'on accorde `a cette valeur. Les diff´erentes ´etapes de notre m´ethode d'annotation de tableaux ont ´et´e ´evalu´ees exp´erimentalement, en prenant comme domaine d'application la microbiologie alimentaire. |
---|