Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’eff...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
EDP Sciences
2016-01-01
|
Series: | SHS Web of Conferences |
Online Access: | http://dx.doi.org/10.1051/shsconf/20162711008 |
id |
doaj-6133015d401645469c12a54283e9e94e |
---|---|
record_format |
Article |
spelling |
doaj-6133015d401645469c12a54283e9e94e2021-02-02T07:12:15ZengEDP SciencesSHS Web of Conferences2261-24242016-01-01271100810.1051/shsconf/20162711008shsconf_cmlf2016_11008Création semi-automatique d’un corpus annoté pour l’analyse d’opinionsSadoun DrissNous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.http://dx.doi.org/10.1051/shsconf/20162711008 |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Sadoun Driss |
spellingShingle |
Sadoun Driss Création semi-automatique d’un corpus annoté pour l’analyse d’opinions SHS Web of Conferences |
author_facet |
Sadoun Driss |
author_sort |
Sadoun Driss |
title |
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions |
title_short |
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions |
title_full |
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions |
title_fullStr |
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions |
title_full_unstemmed |
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions |
title_sort |
création semi-automatique d’un corpus annoté pour l’analyse d’opinions |
publisher |
EDP Sciences |
series |
SHS Web of Conferences |
issn |
2261-2424 |
publishDate |
2016-01-01 |
description |
Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement. |
url |
http://dx.doi.org/10.1051/shsconf/20162711008 |
work_keys_str_mv |
AT sadoundriss creationsemiautomatiqueduncorpusannotepourlanalysedopinions |
_version_ |
1724299833978650624 |