Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel

L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifi...

Full description

Bibliographic Details
Main Author: Noël, Romain
Other Authors: Rouen, INSA
Language:fr
Published: 2014
Subjects:
Online Access:http://www.theses.fr/2014ISAM0011/document
id ndltd-theses.fr-2014ISAM0011
record_format oai_dc
spelling ndltd-theses.fr-2014ISAM00112017-07-01T04:40:06Z Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel Buisness Intelligence contribution : DOWSER, Discovering of Web Sources Evaluating Relevance Exploration ciblée Recherche d'information Profil utilisateur Modélisation besoin informationnel Focused crawling Information retrieval Similarity measure User profile L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifiques et sensibles. Ces pages non populaires sont souvent mal indexées ou non indexées par les moteurs de recherche à cause de leur contenu délicat, les rendant difficile à trouver. Nos travaux, qui s'inscrivent dans ce contenu du Renseignement d'Origine Source Ouverte (ROSO), visent à aider l'expert du renseignement dans sa tâche de découverte de nouvelles sources. Notre approche s'articule autour de la modélisation du besoin opérationnel et de l'exploration ciblée du Web. La modélisation du besoin informationnel permet de guider l'exploration du web pour découvrir et fournir des sources pertinentes à l'expert. The constant growth of the Web in recent years has made more difficult the discovery of new sources of information on a given topic. This is a prominent problem for Expert in Intelligence Analysis (EIA) who are faced with the search of pages on specific and sensitive topics. Because of their lack of popularity or because they are poorly indexed due to their sensitive content, these pages are hard to find with traditional search engine. In this article, we describe a new Web source discovery system called DOWSER. The goal of this system is to provide users with new sources of information related to their needs without considering the popularity of a page unlike classic Information Retrieval tools. The expected result is a balance between relevance and originality, in the sense that the wanted pages are not necessary popular. DOWSER in based on a user profile to focus its exploration of the Web in order to collect and index only related Web documents. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2014ISAM0011/document Noël, Romain 2014-10-17 Rouen, INSA Vercouter, Laurent
collection NDLTD
language fr
sources NDLTD
topic Exploration ciblée
Recherche d'information
Profil utilisateur
Modélisation besoin informationnel
Focused crawling
Information retrieval
Similarity measure
User profile

spellingShingle Exploration ciblée
Recherche d'information
Profil utilisateur
Modélisation besoin informationnel
Focused crawling
Information retrieval
Similarity measure
User profile

Noël, Romain
Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
description L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifiques et sensibles. Ces pages non populaires sont souvent mal indexées ou non indexées par les moteurs de recherche à cause de leur contenu délicat, les rendant difficile à trouver. Nos travaux, qui s'inscrivent dans ce contenu du Renseignement d'Origine Source Ouverte (ROSO), visent à aider l'expert du renseignement dans sa tâche de découverte de nouvelles sources. Notre approche s'articule autour de la modélisation du besoin opérationnel et de l'exploration ciblée du Web. La modélisation du besoin informationnel permet de guider l'exploration du web pour découvrir et fournir des sources pertinentes à l'expert. === The constant growth of the Web in recent years has made more difficult the discovery of new sources of information on a given topic. This is a prominent problem for Expert in Intelligence Analysis (EIA) who are faced with the search of pages on specific and sensitive topics. Because of their lack of popularity or because they are poorly indexed due to their sensitive content, these pages are hard to find with traditional search engine. In this article, we describe a new Web source discovery system called DOWSER. The goal of this system is to provide users with new sources of information related to their needs without considering the popularity of a page unlike classic Information Retrieval tools. The expected result is a balance between relevance and originality, in the sense that the wanted pages are not necessary popular. DOWSER in based on a user profile to focus its exploration of the Web in order to collect and index only related Web documents.
author2 Rouen, INSA
author_facet Rouen, INSA
Noël, Romain
author Noël, Romain
author_sort Noël, Romain
title Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
title_short Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
title_full Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
title_fullStr Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
title_full_unstemmed Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
title_sort contribution à la veille stratégique : dowser, un système de découverte de sources web d’intérêt opérationnel
publishDate 2014
url http://www.theses.fr/2014ISAM0011/document
work_keys_str_mv AT noelromain contributionalaveillestrategiquedowserunsystemededecouvertedesourceswebdinteretoperationnel
AT noelromain buisnessintelligencecontributiondowserdiscoveringofwebsourcesevaluatingrelevance
_version_ 1718488676399316992