Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
Cet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporell...
Main Authors: | , , , , , |
---|---|
Format: | Article |
Language: | English |
Published: |
EDP Sciences
2020-01-01
|
Series: | SHS Web of Conferences |
Online Access: | https://www.shs-conferences.org/articles/shsconf/pdf/2020/06/shsconf_cmlf2020_11004.pdf |
id |
doaj-99313df3c0d94b9c9ef20770624bc403 |
---|---|
record_format |
Article |
spelling |
doaj-99313df3c0d94b9c9ef20770624bc4032021-04-02T11:24:48ZengEDP SciencesSHS Web of Conferences2261-24242020-01-01781100410.1051/shsconf/20207811004shsconf_cmlf2020_11004Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écritWang IlaineAntoine Jean-Yves0Abouda Lotfi1Waszczuk Jakub2Pelletier Aurore3Halftermeyer Anaïs4LIFAT, Université de ToursLLL, Université d’OrléansInstitut für Sprache und Information, Heinrich-Heine-Universität, DüsseldorfLIFAT, Université de ToursLIFO, Université d’OrléansCet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporelle et qui est diffusé librement sous licence Creative Commons. ODIL_Syntax a été créé à l’aide de Contemplata, une plateforme Web d’annotation développée spécifiquement dans le cadre du projet, diffusée elle aussi librement et qui présente l’intérêt de permettre une annotation semi-automatique utilisant un analyseur syntaxique. L’article décrit la procédure d’annotation avec cet outil, nos choix d’annotation ainsi que le corpus produit, en s’intéressant en particulier à une comparaison avec le corpus équivalent FTB (French Treebank) développé pour l’écrit.https://www.shs-conferences.org/articles/shsconf/pdf/2020/06/shsconf_cmlf2020_11004.pdf |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Wang Ilaine Antoine Jean-Yves Abouda Lotfi Waszczuk Jakub Pelletier Aurore Halftermeyer Anaïs |
spellingShingle |
Wang Ilaine Antoine Jean-Yves Abouda Lotfi Waszczuk Jakub Pelletier Aurore Halftermeyer Anaïs Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit SHS Web of Conferences |
author_facet |
Wang Ilaine Antoine Jean-Yves Abouda Lotfi Waszczuk Jakub Pelletier Aurore Halftermeyer Anaïs |
author_sort |
Wang Ilaine |
title |
Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit |
title_short |
Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit |
title_full |
Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit |
title_fullStr |
Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit |
title_full_unstemmed |
Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit |
title_sort |
annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit |
publisher |
EDP Sciences |
series |
SHS Web of Conferences |
issn |
2261-2424 |
publishDate |
2020-01-01 |
description |
Cet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporelle et qui est diffusé librement sous licence Creative Commons. ODIL_Syntax a été créé à l’aide de Contemplata, une plateforme Web d’annotation développée spécifiquement dans le cadre du projet, diffusée elle aussi librement et qui présente l’intérêt de permettre une annotation semi-automatique utilisant un analyseur syntaxique.
L’article décrit la procédure d’annotation avec cet outil, nos choix d’annotation ainsi que le corpus produit, en s’intéressant en particulier à une comparaison avec le corpus équivalent FTB (French Treebank) développé pour l’écrit. |
url |
https://www.shs-conferences.org/articles/shsconf/pdf/2020/06/shsconf_cmlf2020_11004.pdf |
work_keys_str_mv |
AT wangilaine annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit AT antoinejeanyves annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit AT aboudalotfi annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit AT waszczukjakub annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit AT pelletieraurore annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit AT halftermeyeranais annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit |
_version_ |
1724164934032424960 |