Création semi-automatique d’un corpus annoté pour l’analyse d’opinions

Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’eff...

Full description

Bibliographic Details
Main Author: Sadoun Driss
Format: Article
Language:English
Published: EDP Sciences 2016-01-01
Series:SHS Web of Conferences
Online Access:http://dx.doi.org/10.1051/shsconf/20162711008
Description
Summary:Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.
ISSN:2261-2424