Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes

Ce travail a pour objet l'étude de deux méthodes de fouille automatique de textes, l'extraction d'informations et la textométrie, toutes deux mises au service de la veille stratégique des événements économiques. Pour l'extraction d'informations, il s'agit d'identif...

Full description

Bibliographic Details
Main Author: Erin, Macmurray
Language:fra
Published: Université de la Sorbonne nouvelle - Paris III 2012
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00740601
http://tel.archives-ouvertes.fr/docs/00/74/06/01/PDF/MacMurrayThese20120627.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00740601
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-007406012014-10-14T03:31:46Z http://tel.archives-ouvertes.fr/tel-00740601 http://tel.archives-ouvertes.fr/docs/00/74/06/01/PDF/MacMurrayThese20120627.pdf Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes Erin, Macmurray [SCCO:LING] Cognitive science/Linguistics [SCCO:LING] Sciences cognitives/Linguistique [STAT:ME] Statistics/Methodology [STAT:ME] Statistiques/Méthodologie [SHS:LANGUE] Humanities and Social Sciences/Linguistics [SHS:LANGUE] Sciences de l'Homme et Société/Linguistique textométrie extraction d'informations événements veille stratégique fouille de textes discours de presse spécifictés cooccurrences Ce travail a pour objet l'étude de deux méthodes de fouille automatique de textes, l'extraction d'informations et la textométrie, toutes deux mises au service de la veille stratégique des événements économiques. Pour l'extraction d'informations, il s'agit d'identifier et d'étiqueter des unités de connaissances, entités nommées -- sociétés, lieux, personnes, qui servent de points d'entrée pour les analyses d'activités ou d'événements économiques -- fusions, faillites, partenariats, impliquant ces différents acteurs. La méthode textométrique, en revanche, met en oeuvre un ensemble de modèles statistiques permettant l'analyse des distributions de mots dans de vastes corpus, afin faire émerger les caractéristiques significatives des données textuelles. Dans cette recherche, la textométrie, traditionnellement considérée comme étant incompatible avec la fouille par l'extraction, est substituée à cette dernière pour obtenir des informations sur des événements économiques dans le discours. Plusieurs analyses textométriques (spécificités et cooccurrences) sont donc menées sur un corpus de flux de presse numérisé. On étudie ensuite les résultats obtenus grâce à la textométrie en vue de les comparer aux connaissances mises en évidence au moyen d'une procédure d'extraction d'informations. On constate que chacune des approches contribuent différemment au traitement des données textuelles, produisant toutes deux des analyses complémentaires. À l'issue de la comparaison est exposé l'apport des deux méthodes de fouille pour la veille d'événements. 2012-07-02 fra PhD thesis Université de la Sorbonne nouvelle - Paris III
collection NDLTD
language fra
sources NDLTD
topic [SCCO:LING] Cognitive science/Linguistics
[SCCO:LING] Sciences cognitives/Linguistique
[STAT:ME] Statistics/Methodology
[STAT:ME] Statistiques/Méthodologie
[SHS:LANGUE] Humanities and Social Sciences/Linguistics
[SHS:LANGUE] Sciences de l'Homme et Société/Linguistique
textométrie
extraction d'informations
événements
veille stratégique
fouille de textes
discours de presse
spécifictés
cooccurrences
spellingShingle [SCCO:LING] Cognitive science/Linguistics
[SCCO:LING] Sciences cognitives/Linguistique
[STAT:ME] Statistics/Methodology
[STAT:ME] Statistiques/Méthodologie
[SHS:LANGUE] Humanities and Social Sciences/Linguistics
[SHS:LANGUE] Sciences de l'Homme et Société/Linguistique
textométrie
extraction d'informations
événements
veille stratégique
fouille de textes
discours de presse
spécifictés
cooccurrences
Erin, Macmurray
Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes
description Ce travail a pour objet l'étude de deux méthodes de fouille automatique de textes, l'extraction d'informations et la textométrie, toutes deux mises au service de la veille stratégique des événements économiques. Pour l'extraction d'informations, il s'agit d'identifier et d'étiqueter des unités de connaissances, entités nommées -- sociétés, lieux, personnes, qui servent de points d'entrée pour les analyses d'activités ou d'événements économiques -- fusions, faillites, partenariats, impliquant ces différents acteurs. La méthode textométrique, en revanche, met en oeuvre un ensemble de modèles statistiques permettant l'analyse des distributions de mots dans de vastes corpus, afin faire émerger les caractéristiques significatives des données textuelles. Dans cette recherche, la textométrie, traditionnellement considérée comme étant incompatible avec la fouille par l'extraction, est substituée à cette dernière pour obtenir des informations sur des événements économiques dans le discours. Plusieurs analyses textométriques (spécificités et cooccurrences) sont donc menées sur un corpus de flux de presse numérisé. On étudie ensuite les résultats obtenus grâce à la textométrie en vue de les comparer aux connaissances mises en évidence au moyen d'une procédure d'extraction d'informations. On constate que chacune des approches contribuent différemment au traitement des données textuelles, produisant toutes deux des analyses complémentaires. À l'issue de la comparaison est exposé l'apport des deux méthodes de fouille pour la veille d'événements.
author Erin, Macmurray
author_facet Erin, Macmurray
author_sort Erin, Macmurray
title Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes
title_short Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes
title_full Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes
title_fullStr Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes
title_full_unstemmed Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes
title_sort discours de presse et veille stratégique d'événements approche textométrique et extraction d'informations pour la fouille de textes
publisher Université de la Sorbonne nouvelle - Paris III
publishDate 2012
url http://tel.archives-ouvertes.fr/tel-00740601
http://tel.archives-ouvertes.fr/docs/00/74/06/01/PDF/MacMurrayThese20120627.pdf
work_keys_str_mv AT erinmacmurray discoursdepresseetveillestrategiquedevenementsapprochetextometriqueetextractiondinformationspourlafouilledetextes
_version_ 1716716947010224128