Modèles statistiques pour la prédiction de cadres sémantiques

En traitement automatique de la langue, les différentes étapes d'analyse usuelles ont tour à tour amélioré la façon dont le langage peut être modélisé par les machines. Une étape d'analyse encore mal maîtrisée correspond à l'analyse sémantique. Ce type d'analyse permettrait de no...

Full description

Bibliographic Details
Main Author:	Michalon, Olivier
Other Authors:	Aix-Marseille
Language:	fr
Published:	2017
Subjects:	Tal Sémantique Nlp Semantics 004
Online Access:	http://www.theses.fr/2017AIXM0221/document

id	ndltd-theses.fr-2017AIXM0221
record_format	oai_dc
spelling	ndltd-theses.fr-2017AIXM02212018-05-03T04:14:30Z Modèles statistiques pour la prédiction de cadres sémantiques Statistical models for semantic frame prediction Tal Sémantique Nlp Semantics 004 En traitement automatique de la langue, les différentes étapes d'analyse usuelles ont tour à tour amélioré la façon dont le langage peut être modélisé par les machines. Une étape d'analyse encore mal maîtrisée correspond à l'analyse sémantique. Ce type d'analyse permettrait de nombreuses avancées, telles que de meilleures interactions homme-machine ou des traductions plus fiables. Il existe plusieurs structures de représentation du sens telles que PropBank, les AMR et FrameNet. FrameNet correspond à la représentation en cadres sémantiques dont la théorie a été décrite par Charles Fillmore. Dans cette théorie, chaque situation prototypique et les différents éléments y intervenant sont représentés de telle sorte que deux situations similaires soient représentées par le même objet, appelé cadre sémantique. Le projet FrameNet est une application de cette théorie, dans laquelle plusieurs centaines de situations prototypiques sont définies. Le travail que nous décrirons ici s'inscrit dans la continuité des travaux déjà élaborés pour prédire automatiquement des cadres sémantiques. Nous présenterons quatre systèmes de prédiction, chacun ayant permis de valider une hypothèse sur les propriétés nécessaires à une prédiction efficace. Nous verrons également que notre analyse peut être améliorée en fournissant aux modèles de prédiction des informations raffinées au préalable, avec d'un côté une analyse syntaxique dont les liens profonds sont explicités et de l'autre des représentations vectorielles du vocabulaire apprises au préalable. In natural language processing, each analysis step has improved the way in which language can be modeled by machines. Another step of analysis still poorly mastered resides in semantic parsing. This type of analysis can provide information which would allow for many advances, such as better human-machine interactions or more reliable translations. There exist several types of meaning representation structures, such as PropBank, AMR and FrameNet. FrameNet corresponds to the frame semantic framework whose theory has been described by Charles Fillmore (1971). In this theory, each prototypical situation and each different elements involved are represented in such a way that two similar situations are represented by the same object, called a semantic frame. The work that we will describe here follows the work already developed for machine prediction of frame semantic representations. We will present four prediction systems, and each one of them allowed to validate another hypothesis on the necessary properties for effective prediction. We will show that semantic parsing can also be improved by providing prediction models with refined information as input of the system, with firstly a syntactic analysis where deep links are made explicit and secondly vectorial representations of the vocabulary learned beforehand. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2017AIXM0221/document Michalon, Olivier 2017-10-04 Aix-Marseille Nasr, Alexis Favre, Benoît
collection	NDLTD
language	fr
sources	NDLTD
topic	Tal Sémantique Nlp Semantics 004
spellingShingle	Tal Sémantique Nlp Semantics 004 Michalon, Olivier Modèles statistiques pour la prédiction de cadres sémantiques
description	En traitement automatique de la langue, les différentes étapes d'analyse usuelles ont tour à tour amélioré la façon dont le langage peut être modélisé par les machines. Une étape d'analyse encore mal maîtrisée correspond à l'analyse sémantique. Ce type d'analyse permettrait de nombreuses avancées, telles que de meilleures interactions homme-machine ou des traductions plus fiables. Il existe plusieurs structures de représentation du sens telles que PropBank, les AMR et FrameNet. FrameNet correspond à la représentation en cadres sémantiques dont la théorie a été décrite par Charles Fillmore. Dans cette théorie, chaque situation prototypique et les différents éléments y intervenant sont représentés de telle sorte que deux situations similaires soient représentées par le même objet, appelé cadre sémantique. Le projet FrameNet est une application de cette théorie, dans laquelle plusieurs centaines de situations prototypiques sont définies. Le travail que nous décrirons ici s'inscrit dans la continuité des travaux déjà élaborés pour prédire automatiquement des cadres sémantiques. Nous présenterons quatre systèmes de prédiction, chacun ayant permis de valider une hypothèse sur les propriétés nécessaires à une prédiction efficace. Nous verrons également que notre analyse peut être améliorée en fournissant aux modèles de prédiction des informations raffinées au préalable, avec d'un côté une analyse syntaxique dont les liens profonds sont explicités et de l'autre des représentations vectorielles du vocabulaire apprises au préalable. === In natural language processing, each analysis step has improved the way in which language can be modeled by machines. Another step of analysis still poorly mastered resides in semantic parsing. This type of analysis can provide information which would allow for many advances, such as better human-machine interactions or more reliable translations. There exist several types of meaning representation structures, such as PropBank, AMR and FrameNet. FrameNet corresponds to the frame semantic framework whose theory has been described by Charles Fillmore (1971). In this theory, each prototypical situation and each different elements involved are represented in such a way that two similar situations are represented by the same object, called a semantic frame. The work that we will describe here follows the work already developed for machine prediction of frame semantic representations. We will present four prediction systems, and each one of them allowed to validate another hypothesis on the necessary properties for effective prediction. We will show that semantic parsing can also be improved by providing prediction models with refined information as input of the system, with firstly a syntactic analysis where deep links are made explicit and secondly vectorial representations of the vocabulary learned beforehand.
author2	Aix-Marseille
author_facet	Aix-Marseille Michalon, Olivier
author	Michalon, Olivier
author_sort	Michalon, Olivier
title	Modèles statistiques pour la prédiction de cadres sémantiques
title_short	Modèles statistiques pour la prédiction de cadres sémantiques
title_full	Modèles statistiques pour la prédiction de cadres sémantiques
title_fullStr	Modèles statistiques pour la prédiction de cadres sémantiques
title_full_unstemmed	Modèles statistiques pour la prédiction de cadres sémantiques
title_sort	modèles statistiques pour la prédiction de cadres sémantiques
publishDate	2017
url	http://www.theses.fr/2017AIXM0221/document
work_keys_str_mv	AT michalonolivier modelesstatistiquespourlapredictiondecadressemantiques AT michalonolivier statisticalmodelsforsemanticframeprediction
_version_	1718634730141777920

Modèles statistiques pour la prédiction de cadres sémantiques

Similar Items