Des régularités sémantico-syntaxiques sous-jacentes

Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques...

Full description

Bibliographic Details
Main Author:	Decobert Bernard
Format:	Article
Language:	English
Published:	EDP Sciences 2014-07-01
Series:	SHS Web of Conferences
Online Access:	http://dx.doi.org/10.1051/shsconf/20140801068

id	doaj-f2e6c80837b04a39825a6cd79aa9c91e
record_format	Article
spelling	doaj-f2e6c80837b04a39825a6cd79aa9c91e2021-02-02T09:03:39ZengEDP SciencesSHS Web of Conferences2261-24242014-07-0182735275010.1051/shsconf/20140801068shsconf_cmlf14_01068Des régularités sémantico-syntaxiques sous-jacentesDecobert Bernard Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques, conclut à l’existence probable dans le langage d’une structure linéaire sous-jacente non aléatoire plus précisément, d’une structure conceptuelle hiérarchisée se présentant sous la forme d’une séquence récurrente type. L’étude prend le texte pour objet et s’inscrit dans le cadre général de l’élaboration d’une méthodologie et d’une instrumentation pour l’analyse des phénomènes interprétatifs (sémantique, analyse du dis-cours, syntaxe, sémiotique). L’étude s’est attachée à repérer et modéliser ces catégories sémantiques qui relèvent a priori d’un système organisé. Elle cherche à cerner la nature, la portée et les mécanismes inductifs et/ou logiques susceptibles d’incrémenter ces catégories sémantiques. L’approche méthodologique permet aujourd’hui de classer environ 12 000 lemmes (flexions comprises) dans une vingtaine de catégories sémantiques. Bien que cette étude se situe dans la lignée des travaux de recherche sur la construction automatique et approximative du sens d’un texte par les techniques de « clustering » révélant des thèmes sémantiques, elle s’en différencie principalement par l’originalité de la base lexicale. Les résultats encore partiels montre qu’il existe des raisons objectives d’envisager l’existence d’un processus cognitif singulier analysable à partir d’unités sémiques fondamentales. Cette proposition interpelle le champ des préoccupations de la linguistique cognitive. Il s’agit aujourd’hui d’évaluer plus finement l’intérêt d’une telle structure conceptuelle hiérarchisée en particulier des points de vue syntaxique et sémantique (désambiguïsation, segmentation thématique automatique…) et d’envisager son traitement sur de grands corpus. http://dx.doi.org/10.1051/shsconf/20140801068
collection	DOAJ
language	English
format	Article
sources	DOAJ
author	Decobert Bernard
spellingShingle	Decobert Bernard Des régularités sémantico-syntaxiques sous-jacentes SHS Web of Conferences
author_facet	Decobert Bernard
author_sort	Decobert Bernard
title	Des régularités sémantico-syntaxiques sous-jacentes
title_short	Des régularités sémantico-syntaxiques sous-jacentes
title_full	Des régularités sémantico-syntaxiques sous-jacentes
title_fullStr	Des régularités sémantico-syntaxiques sous-jacentes
title_full_unstemmed	Des régularités sémantico-syntaxiques sous-jacentes
title_sort	des régularités sémantico-syntaxiques sous-jacentes
publisher	EDP Sciences
series	SHS Web of Conferences
issn	2261-2424
publishDate	2014-07-01
description	Des alignements répétitifs d’une vingtaine de catégories sémantiques (CS) indépendants de toutes limites de phrases ou de paragraphes, apparaissent dans des articles de presse en français (type dépêche - 300 à 1200 mots). L’analyse du phénomène, qui s’appuie notamment sur des étapes statistiques, conclut à l’existence probable dans le langage d’une structure linéaire sous-jacente non aléatoire plus précisément, d’une structure conceptuelle hiérarchisée se présentant sous la forme d’une séquence récurrente type. L’étude prend le texte pour objet et s’inscrit dans le cadre général de l’élaboration d’une méthodologie et d’une instrumentation pour l’analyse des phénomènes interprétatifs (sémantique, analyse du dis-cours, syntaxe, sémiotique). L’étude s’est attachée à repérer et modéliser ces catégories sémantiques qui relèvent a priori d’un système organisé. Elle cherche à cerner la nature, la portée et les mécanismes inductifs et/ou logiques susceptibles d’incrémenter ces catégories sémantiques. L’approche méthodologique permet aujourd’hui de classer environ 12 000 lemmes (flexions comprises) dans une vingtaine de catégories sémantiques. Bien que cette étude se situe dans la lignée des travaux de recherche sur la construction automatique et approximative du sens d’un texte par les techniques de « clustering » révélant des thèmes sémantiques, elle s’en différencie principalement par l’originalité de la base lexicale. Les résultats encore partiels montre qu’il existe des raisons objectives d’envisager l’existence d’un processus cognitif singulier analysable à partir d’unités sémiques fondamentales. Cette proposition interpelle le champ des préoccupations de la linguistique cognitive. Il s’agit aujourd’hui d’évaluer plus finement l’intérêt d’une telle structure conceptuelle hiérarchisée en particulier des points de vue syntaxique et sémantique (désambiguïsation, segmentation thématique automatique…) et d’envisager son traitement sur de grands corpus.
url	http://dx.doi.org/10.1051/shsconf/20140801068
work_keys_str_mv	AT decobertbernard desregularitessemanticosyntaxiquessousjacentes
_version_	1724295796824735744

Des régularités sémantico-syntaxiques sous-jacentes

Similar Items