Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit

Cet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporell...

Full description

Bibliographic Details
Main Authors: Wang Ilaine, Antoine Jean-Yves, Abouda Lotfi, Waszczuk Jakub, Pelletier Aurore, Halftermeyer Anaïs
Format: Article
Language:English
Published: EDP Sciences 2020-01-01
Series:SHS Web of Conferences
Online Access:https://www.shs-conferences.org/articles/shsconf/pdf/2020/06/shsconf_cmlf2020_11004.pdf
id doaj-99313df3c0d94b9c9ef20770624bc403
record_format Article
spelling doaj-99313df3c0d94b9c9ef20770624bc4032021-04-02T11:24:48ZengEDP SciencesSHS Web of Conferences2261-24242020-01-01781100410.1051/shsconf/20207811004shsconf_cmlf2020_11004Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écritWang IlaineAntoine Jean-Yves0Abouda Lotfi1Waszczuk Jakub2Pelletier Aurore3Halftermeyer Anaïs4LIFAT, Université de ToursLLL, Université d’OrléansInstitut für Sprache und Information, Heinrich-Heine-Universität, DüsseldorfLIFAT, Université de ToursLIFO, Université d’OrléansCet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporelle et qui est diffusé librement sous licence Creative Commons. ODIL_Syntax a été créé à l’aide de Contemplata, une plateforme Web d’annotation développée spécifiquement dans le cadre du projet, diffusée elle aussi librement et qui présente l’intérêt de permettre une annotation semi-automatique utilisant un analyseur syntaxique. L’article décrit la procédure d’annotation avec cet outil, nos choix d’annotation ainsi que le corpus produit, en s’intéressant en particulier à une comparaison avec le corpus équivalent FTB (French Treebank) développé pour l’écrit.https://www.shs-conferences.org/articles/shsconf/pdf/2020/06/shsconf_cmlf2020_11004.pdf
collection DOAJ
language English
format Article
sources DOAJ
author Wang Ilaine
Antoine Jean-Yves
Abouda Lotfi
Waszczuk Jakub
Pelletier Aurore
Halftermeyer Anaïs
spellingShingle Wang Ilaine
Antoine Jean-Yves
Abouda Lotfi
Waszczuk Jakub
Pelletier Aurore
Halftermeyer Anaïs
Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
SHS Web of Conferences
author_facet Wang Ilaine
Antoine Jean-Yves
Abouda Lotfi
Waszczuk Jakub
Pelletier Aurore
Halftermeyer Anaïs
author_sort Wang Ilaine
title Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
title_short Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
title_full Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
title_fullStr Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
title_full_unstemmed Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
title_sort annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
publisher EDP Sciences
series SHS Web of Conferences
issn 2261-2424
publishDate 2020-01-01
description Cet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporelle et qui est diffusé librement sous licence Creative Commons. ODIL_Syntax a été créé à l’aide de Contemplata, une plateforme Web d’annotation développée spécifiquement dans le cadre du projet, diffusée elle aussi librement et qui présente l’intérêt de permettre une annotation semi-automatique utilisant un analyseur syntaxique. L’article décrit la procédure d’annotation avec cet outil, nos choix d’annotation ainsi que le corpus produit, en s’intéressant en particulier à une comparaison avec le corpus équivalent FTB (French Treebank) développé pour l’écrit.
url https://www.shs-conferences.org/articles/shsconf/pdf/2020/06/shsconf_cmlf2020_11004.pdf
work_keys_str_mv AT wangilaine annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit
AT antoinejeanyves annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit
AT aboudalotfi annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit
AT waszczukjakub annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit
AT pelletieraurore annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit
AT halftermeyeranais annoterlaparolespontaneeenarbresdeconstituantspourlesbesoinsdelanalysetemporelleresultatsetcomparaisonfrancaisparlefrancaisecrit
_version_ 1724164934032424960