Des régularités sémantico-syntaxiques sous-jacentes

Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques...

Full description

Bibliographic Details
Main Author: Decobert Bernard
Format: Article
Language:English
Published: EDP Sciences 2014-07-01
Series:SHS Web of Conferences
Online Access:http://dx.doi.org/10.1051/shsconf/20140801068
id doaj-f2e6c80837b04a39825a6cd79aa9c91e
record_format Article
spelling doaj-f2e6c80837b04a39825a6cd79aa9c91e2021-02-02T09:03:39ZengEDP SciencesSHS Web of Conferences2261-24242014-07-0182735275010.1051/shsconf/20140801068shsconf_cmlf14_01068Des régularités sémantico-syntaxiques sous-jacentesDecobert Bernard Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques, conclut à l’existence probable dans le langage d’une structure linéaire sous-jacente non aléatoire plus précisément, d’une structure conceptuelle hiérarchisée se présentant sous la forme d’une séquence récurrente type. L’étude prend le texte pour objet et s’inscrit dans le cadre général de l’élaboration d’une méthodologie et d’une instrumentation pour l’analyse des phénomènes interprétatifs (sémantique, analyse du dis-cours, syntaxe, sémiotique). L’étude s’est attachée à repérer et modéliser ces catégories sémantiques qui relèvent a priori d’un système organisé. Elle cherche à cerner la nature, la portée et les mécanismes inductifs et/ou logiques susceptibles d’incrémenter ces catégories sémantiques. L’approche méthodologique permet aujourd’hui de classer environ 12 000 lemmes (flexions comprises) dans une vingtaine de catégories sémantiques. Bien que cette étude se situe dans la lignée des travaux de recherche sur la construction automatique et approximative du sens d’un texte par les techniques de « clustering » révélant des thèmes sémantiques, elle s’en différencie principalement par l’originalité de la base lexicale. Les résultats encore partiels montre qu’il existe des raisons objectives d’envisager l’existence d’un processus cognitif singulier analysable à partir d’unités sémiques fondamentales. Cette proposition interpelle le champ des préoccupations de la linguistique cognitive. Il s’agit aujourd’hui d’évaluer plus finement l’intérêt d’une telle structure conceptuelle hiérarchisée en particulier des points de vue syntaxique et sémantique (désambiguïsation, segmentation thématique automatique…) et d’envisager son traitement sur de grands corpus. http://dx.doi.org/10.1051/shsconf/20140801068
collection DOAJ
language English
format Article
sources DOAJ
author Decobert Bernard
spellingShingle Decobert Bernard
Des régularités sémantico-syntaxiques sous-jacentes
SHS Web of Conferences
author_facet Decobert Bernard
author_sort Decobert Bernard
title Des régularités sémantico-syntaxiques sous-jacentes
title_short Des régularités sémantico-syntaxiques sous-jacentes
title_full Des régularités sémantico-syntaxiques sous-jacentes
title_fullStr Des régularités sémantico-syntaxiques sous-jacentes
title_full_unstemmed Des régularités sémantico-syntaxiques sous-jacentes
title_sort des régularités sémantico-syntaxiques sous-jacentes
publisher EDP Sciences
series SHS Web of Conferences
issn 2261-2424
publishDate 2014-07-01
description Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques, conclut à l’existence probable dans le langage d’une structure linéaire sous-jacente non aléatoire plus précisément, d’une structure conceptuelle hiérarchisée se présentant sous la forme d’une séquence récurrente type. L’étude prend le texte pour objet et s’inscrit dans le cadre général de l’élaboration d’une méthodologie et d’une instrumentation pour l’analyse des phénomènes interprétatifs (sémantique, analyse du dis-cours, syntaxe, sémiotique). L’étude s’est attachée à repérer et modéliser ces catégories sémantiques qui relèvent a priori d’un système organisé. Elle cherche à cerner la nature, la portée et les mécanismes inductifs et/ou logiques susceptibles d’incrémenter ces catégories sémantiques. L’approche méthodologique permet aujourd’hui de classer environ 12 000 lemmes (flexions comprises) dans une vingtaine de catégories sémantiques. Bien que cette étude se situe dans la lignée des travaux de recherche sur la construction automatique et approximative du sens d’un texte par les techniques de « clustering » révélant des thèmes sémantiques, elle s’en différencie principalement par l’originalité de la base lexicale. Les résultats encore partiels montre qu’il existe des raisons objectives d’envisager l’existence d’un processus cognitif singulier analysable à partir d’unités sémiques fondamentales. Cette proposition interpelle le champ des préoccupations de la linguistique cognitive. Il s’agit aujourd’hui d’évaluer plus finement l’intérêt d’une telle structure conceptuelle hiérarchisée en particulier des points de vue syntaxique et sémantique (désambiguïsation, segmentation thématique automatique…) et d’envisager son traitement sur de grands corpus.
url http://dx.doi.org/10.1051/shsconf/20140801068
work_keys_str_mv AT decobertbernard desregularitessemanticosyntaxiquessousjacentes
_version_ 1724295796824735744