Création semi-automatique d’un corpus annoté pour l’analyse d’opinions

Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’eff...

Full description

Bibliographic Details
Main Author: Sadoun Driss
Format: Article
Language:English
Published: EDP Sciences 2016-01-01
Series:SHS Web of Conferences
Online Access:http://dx.doi.org/10.1051/shsconf/20162711008
id doaj-6133015d401645469c12a54283e9e94e
record_format Article
spelling doaj-6133015d401645469c12a54283e9e94e2021-02-02T07:12:15ZengEDP SciencesSHS Web of Conferences2261-24242016-01-01271100810.1051/shsconf/20162711008shsconf_cmlf2016_11008Création semi-automatique d’un corpus annoté pour l’analyse d’opinionsSadoun DrissNous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.http://dx.doi.org/10.1051/shsconf/20162711008
collection DOAJ
language English
format Article
sources DOAJ
author Sadoun Driss
spellingShingle Sadoun Driss
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
SHS Web of Conferences
author_facet Sadoun Driss
author_sort Sadoun Driss
title Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_short Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_full Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_fullStr Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_full_unstemmed Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_sort création semi-automatique d’un corpus annoté pour l’analyse d’opinions
publisher EDP Sciences
series SHS Web of Conferences
issn 2261-2424
publishDate 2016-01-01
description Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.
url http://dx.doi.org/10.1051/shsconf/20162711008
work_keys_str_mv AT sadoundriss creationsemiautomatiqueduncorpusannotepourlanalysedopinions
_version_ 1724299833978650624