Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’eff...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
EDP Sciences
2016-01-01
|
Series: | SHS Web of Conferences |
Online Access: | http://dx.doi.org/10.1051/shsconf/20162711008 |
Summary: | Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement. |
---|---|
ISSN: | 2261-2424 |