Applications exploratoires des modèles de spins au traitement automatique de la langue

Dans cette thèse nous avons exploré la capacité des modèles magnétiques de la physique statistique à extraire l'information essentielle contenue dans les textes. Les documents ont été représentés comme des ensembles d'unités en interaction magnétique, l'intensité de telles interaction...

Full description

Bibliographic Details
Main Author:	Fernández Sabido, Silvia Fidelina
Other Authors:	Nancy 1
Language:	fr
Published:	2009
Subjects:	Energie textuelle Verre textuel Modèle de Hopfield Compression de phrases Résumé automatique Modèle de spin Frontière thématique
Online Access:	http://www.theses.fr/2009NAN10055/document

id	ndltd-theses.fr-2009NAN10055
record_format	oai_dc
spelling	ndltd-theses.fr-2009NAN100552020-01-11T03:27:32Z Applications exploratoires des modèles de spins au traitement automatique de la langue Exploratory applications of spin models in Natural Language Processing Energie textuelle Verre textuel Modèle de Hopfield Compression de phrases Résumé automatique Modèle de spin Frontière thématique Dans cette thèse nous avons exploré la capacité des modèles magnétiques de la physique statistique à extraire l'information essentielle contenue dans les textes. Les documents ont été représentés comme des ensembles d'unités en interaction magnétique, l'intensité de telles interactions a été mesurée et utilisée pour calculer de quantités qui sont des indices de l'importance de l'information portée. Nous proposons deux nouvelles méthodes. Premièrement, nous avons étudié un modèle de spins qui nous a permis d'introduire l'énergie textuelle d'un document. Cette quantité a été utilisée comme indicatrice de pertinence et appliquée à une vaste palette de tâches telles que le résumé automatique, la recherche d'information, la classification de documents et la segmentation thématique. Par ailleurs, et de façon encore exploratoire, nous proposons un deuxième algorithme qui définie un couplage grammatical pour conserver les termes importants et produire des contractions. De cette façon, la compression d'une phrase est l'état fondamental de la chaîne de termes. Comme cette compression n'est pas forcement bonne, il a été intéressant de produire des variantes en permettant des fluctuations thermiques. Nous avons fait des simulations Métropolis Monte-Carlo avec le but de trouver l'état fondamental de ce système qui est analogue au verre de spin. In this thesis we explored the ability of magnetic models of statistical physics to extract the essential information contained in texts. Documents are represented as sets of interacting magnetic units, the intensity of such interactions are measured and they are used to calculate quantities that are evidence of the importance of information scope. We propose two new methods. Firstly, we studied a spin model which allowed us to introduce the textual energy. This quantity was used as an indicator of information relevance. Several adaptations were necessary to adapt the energy calculation to a wide range of tasks such as summarisation, information retrieval, document classification and thematic segmentation. Furthermore, and even exploratory, we propose a second algorithm that defines a grammatical coupling between types of terms to retain the important terms and produce contractions. In this way, the compression of a sentence is the ground state of the chain of terms. As this compression is not necessarily good, it was interesting produce variants by thermal fluctuations. We have done simulations Metropolis Monte-Carlo with the aim of finding the ground state of this system that is analogous to spin glass. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2009NAN10055/document Fernández Sabido, Silvia Fidelina 2009-05-22 Nancy 1 Berche, Bertrand Torres-Moreno, Juan-Manuel
collection	NDLTD
language	fr
sources	NDLTD
topic	Energie textuelle Verre textuel Modèle de Hopfield Compression de phrases Résumé automatique Modèle de spin Frontière thématique
spellingShingle	Energie textuelle Verre textuel Modèle de Hopfield Compression de phrases Résumé automatique Modèle de spin Frontière thématique Fernández Sabido, Silvia Fidelina Applications exploratoires des modèles de spins au traitement automatique de la langue
description	Dans cette thèse nous avons exploré la capacité des modèles magnétiques de la physique statistique à extraire l'information essentielle contenue dans les textes. Les documents ont été représentés comme des ensembles d'unités en interaction magnétique, l'intensité de telles interactions a été mesurée et utilisée pour calculer de quantités qui sont des indices de l'importance de l'information portée. Nous proposons deux nouvelles méthodes. Premièrement, nous avons étudié un modèle de spins qui nous a permis d'introduire l'énergie textuelle d'un document. Cette quantité a été utilisée comme indicatrice de pertinence et appliquée à une vaste palette de tâches telles que le résumé automatique, la recherche d'information, la classification de documents et la segmentation thématique. Par ailleurs, et de façon encore exploratoire, nous proposons un deuxième algorithme qui définie un couplage grammatical pour conserver les termes importants et produire des contractions. De cette façon, la compression d'une phrase est l'état fondamental de la chaîne de termes. Comme cette compression n'est pas forcement bonne, il a été intéressant de produire des variantes en permettant des fluctuations thermiques. Nous avons fait des simulations Métropolis Monte-Carlo avec le but de trouver l'état fondamental de ce système qui est analogue au verre de spin. === In this thesis we explored the ability of magnetic models of statistical physics to extract the essential information contained in texts. Documents are represented as sets of interacting magnetic units, the intensity of such interactions are measured and they are used to calculate quantities that are evidence of the importance of information scope. We propose two new methods. Firstly, we studied a spin model which allowed us to introduce the textual energy. This quantity was used as an indicator of information relevance. Several adaptations were necessary to adapt the energy calculation to a wide range of tasks such as summarisation, information retrieval, document classification and thematic segmentation. Furthermore, and even exploratory, we propose a second algorithm that defines a grammatical coupling between types of terms to retain the important terms and produce contractions. In this way, the compression of a sentence is the ground state of the chain of terms. As this compression is not necessarily good, it was interesting produce variants by thermal fluctuations. We have done simulations Metropolis Monte-Carlo with the aim of finding the ground state of this system that is analogous to spin glass.
author2	Nancy 1
author_facet	Nancy 1 Fernández Sabido, Silvia Fidelina
author	Fernández Sabido, Silvia Fidelina
author_sort	Fernández Sabido, Silvia Fidelina
title	Applications exploratoires des modèles de spins au traitement automatique de la langue
title_short	Applications exploratoires des modèles de spins au traitement automatique de la langue
title_full	Applications exploratoires des modèles de spins au traitement automatique de la langue
title_fullStr	Applications exploratoires des modèles de spins au traitement automatique de la langue
title_full_unstemmed	Applications exploratoires des modèles de spins au traitement automatique de la langue
title_sort	applications exploratoires des modèles de spins au traitement automatique de la langue
publishDate	2009
url	http://www.theses.fr/2009NAN10055/document
work_keys_str_mv	AT fernandezsabidosilviafidelina applicationsexploratoiresdesmodelesdespinsautraitementautomatiquedelalangue AT fernandezsabidosilviafidelina exploratoryapplicationsofspinmodelsinnaturallanguageprocessing
_version_	1719307999139332096

Applications exploratoires des modèles de spins au traitement automatique de la langue

Similar Items