Des régularités sémantico-syntaxiques sous-jacentes
Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
EDP Sciences
2014-07-01
|
Series: | SHS Web of Conferences |
Online Access: | http://dx.doi.org/10.1051/shsconf/20140801068 |
id |
doaj-f2e6c80837b04a39825a6cd79aa9c91e |
---|---|
record_format |
Article |
spelling |
doaj-f2e6c80837b04a39825a6cd79aa9c91e2021-02-02T09:03:39ZengEDP SciencesSHS Web of Conferences2261-24242014-07-0182735275010.1051/shsconf/20140801068shsconf_cmlf14_01068Des régularités sémantico-syntaxiques sous-jacentesDecobert Bernard Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques, conclut à l’existence probable dans le langage d’une structure linéaire sous-jacente non aléatoire plus précisément, d’une structure conceptuelle hiérarchisée se présentant sous la forme d’une séquence récurrente type. L’étude prend le texte pour objet et s’inscrit dans le cadre général de l’élaboration d’une méthodologie et d’une instrumentation pour l’analyse des phénomènes interprétatifs (sémantique, analyse du dis-cours, syntaxe, sémiotique). L’étude s’est attachée à repérer et modéliser ces catégories sémantiques qui relèvent a priori d’un système organisé. Elle cherche à cerner la nature, la portée et les mécanismes inductifs et/ou logiques susceptibles d’incrémenter ces catégories sémantiques. L’approche méthodologique permet aujourd’hui de classer environ 12 000 lemmes (flexions comprises) dans une vingtaine de catégories sémantiques. Bien que cette étude se situe dans la lignée des travaux de recherche sur la construction automatique et approximative du sens d’un texte par les techniques de « clustering » révélant des thèmes sémantiques, elle s’en différencie principalement par l’originalité de la base lexicale. Les résultats encore partiels montre qu’il existe des raisons objectives d’envisager l’existence d’un processus cognitif singulier analysable à partir d’unités sémiques fondamentales. Cette proposition interpelle le champ des préoccupations de la linguistique cognitive. Il s’agit aujourd’hui d’évaluer plus finement l’intérêt d’une telle structure conceptuelle hiérarchisée en particulier des points de vue syntaxique et sémantique (désambiguïsation, segmentation thématique automatique…) et d’envisager son traitement sur de grands corpus. http://dx.doi.org/10.1051/shsconf/20140801068 |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Decobert Bernard |
spellingShingle |
Decobert Bernard Des régularités sémantico-syntaxiques sous-jacentes SHS Web of Conferences |
author_facet |
Decobert Bernard |
author_sort |
Decobert Bernard |
title |
Des régularités sémantico-syntaxiques sous-jacentes |
title_short |
Des régularités sémantico-syntaxiques sous-jacentes |
title_full |
Des régularités sémantico-syntaxiques sous-jacentes |
title_fullStr |
Des régularités sémantico-syntaxiques sous-jacentes |
title_full_unstemmed |
Des régularités sémantico-syntaxiques sous-jacentes |
title_sort |
des régularités sémantico-syntaxiques sous-jacentes |
publisher |
EDP Sciences |
series |
SHS Web of Conferences |
issn |
2261-2424 |
publishDate |
2014-07-01 |
description |
Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques, conclut à l’existence probable dans le langage d’une structure linéaire sous-jacente non aléatoire plus précisément, d’une structure conceptuelle hiérarchisée se présentant sous la forme d’une séquence récurrente type. L’étude prend le texte pour objet et s’inscrit dans le cadre général de l’élaboration d’une méthodologie et d’une instrumentation pour l’analyse des phénomènes interprétatifs (sémantique, analyse du dis-cours, syntaxe, sémiotique). L’étude s’est attachée à repérer et modéliser ces catégories sémantiques qui relèvent a priori d’un système organisé. Elle cherche à cerner la nature, la portée et les mécanismes inductifs et/ou logiques susceptibles d’incrémenter ces catégories sémantiques. L’approche méthodologique permet aujourd’hui de classer environ 12 000 lemmes (flexions comprises) dans une vingtaine de catégories sémantiques. Bien que cette étude se situe dans la lignée des travaux de recherche sur la construction automatique et approximative du sens d’un texte par les techniques de « clustering » révélant des thèmes sémantiques, elle s’en différencie principalement par l’originalité de la base lexicale.
Les résultats encore partiels montre qu’il existe des raisons objectives d’envisager l’existence d’un processus cognitif singulier analysable à partir d’unités sémiques fondamentales.
Cette proposition interpelle le champ des préoccupations de la linguistique cognitive. Il s’agit aujourd’hui d’évaluer plus finement l’intérêt d’une telle structure conceptuelle hiérarchisée en particulier des points de vue syntaxique et sémantique (désambiguïsation, segmentation thématique automatique…) et d’envisager son traitement sur de grands corpus.
|
url |
http://dx.doi.org/10.1051/shsconf/20140801068 |
work_keys_str_mv |
AT decobertbernard desregularitessemanticosyntaxiquessousjacentes |
_version_ |
1724295796824735744 |