Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse
Nous nous intéressons à la notion de prise en charge énonciative et modale au travers de la mise en place d’un système d’annotation automatique de textes. Le système s’appuie sur un ensemble de règles heuristiques couplant ressources sémantiques et analyse syntaxique robuste. Il permet le repéra...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
EDP Sciences
2014-07-01
|
Series: | SHS Web of Conferences |
Online Access: | http://dx.doi.org/10.1051/shsconf/20140801254 |
id |
doaj-5d80d40ea7334632a6d1952c6512c300 |
---|---|
record_format |
Article |
spelling |
doaj-5d80d40ea7334632a6d1952c6512c3002021-04-02T11:25:45ZengEDP SciencesSHS Web of Conferences2261-24242014-07-0182597261110.1051/shsconf/20140801254shsconf_cmlf14_01254Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presseDamiani MarineBattistelli Delphine Nous nous intéressons à la notion de prise en charge énonciative et modale au travers de la mise en place d’un système d’annotation automatique de textes. Le système s’appuie sur un ensemble de règles heuristiques couplant ressources sémantiques et analyse syntaxique robuste. Il permet le repérage et l’annotation de segments textuels. Ces segments résultent de la recherche de la portée sémantique de divers indices lexicaux et grammaticaux de prise en charge énonciative et modale (verbes modaux, temps verbaux, constructions de type conditionnelles, etc.) dans une phrase. Une des difficultés réside dans le fait que de nombreux indices peuvent être présents simultanément dans une phrase, complexifiant ainsi l'interprétation de la portée de chaque indice. Nous présentons dans cet article la méthodologie sur laquelle le système repose, son évaluation sur un corpus de dépêches de presse ainsi que son utilisation au sein d’un système de recherche d’information. L’évaluation du système, en plus d’apporter un regard sur son efficience, permet d’envisager un retour réflexif sur le développement du système d’annotation. Au sein d’un système de Recherche d’Information, le système permet à des journalistes de construire des chronologies en intégrant des filtres relatifs à la modalité épistémique et / ou à une distanciation énonciative (de type discours rapporté). http://dx.doi.org/10.1051/shsconf/20140801254 |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Damiani Marine Battistelli Delphine |
spellingShingle |
Damiani Marine Battistelli Delphine Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse SHS Web of Conferences |
author_facet |
Damiani Marine Battistelli Delphine |
author_sort |
Damiani Marine |
title |
Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse |
title_short |
Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse |
title_full |
Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse |
title_fullStr |
Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse |
title_full_unstemmed |
Prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse |
title_sort |
prise en charge et phénomènes de portée : retour d’expériences dans un corpus de dépêches de presse |
publisher |
EDP Sciences |
series |
SHS Web of Conferences |
issn |
2261-2424 |
publishDate |
2014-07-01 |
description |
Nous nous intéressons à la notion de prise en charge énonciative et modale au travers de la mise en place d’un système d’annotation automatique de textes. Le système s’appuie sur un ensemble de règles heuristiques couplant ressources sémantiques et analyse syntaxique robuste. Il permet le repérage et l’annotation de segments textuels. Ces segments résultent de la recherche de la portée sémantique de divers indices lexicaux et grammaticaux de prise en charge énonciative et modale (verbes modaux, temps verbaux, constructions de type conditionnelles, etc.) dans une phrase. Une des difficultés réside dans le fait que de nombreux indices peuvent être présents simultanément dans une phrase, complexifiant ainsi l'interprétation de la portée de chaque indice. Nous présentons dans cet article la méthodologie sur laquelle le système repose, son évaluation sur un corpus de dépêches de presse ainsi que son utilisation au sein d’un système de recherche d’information. L’évaluation du système, en plus d’apporter un regard sur son efficience, permet d’envisager un retour réflexif sur le développement du système d’annotation. Au sein d’un système de Recherche d’Information, le système permet à des journalistes de construire des chronologies en intégrant des filtres relatifs à la modalité épistémique et / ou à une distanciation énonciative (de type discours rapporté).
|
url |
http://dx.doi.org/10.1051/shsconf/20140801254 |
work_keys_str_mv |
AT damianimarine priseenchargeetphenomenesdeporteeretourdexperiencesdansuncorpusdedepechesdepresse AT battistellidelphine priseenchargeetphenomenesdeporteeretourdexperiencesdansuncorpusdedepechesdepresse |
_version_ |
1724164806881050624 |