Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel
L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifi...
Main Author: | |
---|---|
Other Authors: | |
Language: | fr |
Published: |
2014
|
Subjects: | |
Online Access: | http://www.theses.fr/2014ISAM0011/document |
id |
ndltd-theses.fr-2014ISAM0011 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-theses.fr-2014ISAM00112017-07-01T04:40:06Z Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel Buisness Intelligence contribution : DOWSER, Discovering of Web Sources Evaluating Relevance Exploration ciblée Recherche d'information Profil utilisateur Modélisation besoin informationnel Focused crawling Information retrieval Similarity measure User profile L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifiques et sensibles. Ces pages non populaires sont souvent mal indexées ou non indexées par les moteurs de recherche à cause de leur contenu délicat, les rendant difficile à trouver. Nos travaux, qui s'inscrivent dans ce contenu du Renseignement d'Origine Source Ouverte (ROSO), visent à aider l'expert du renseignement dans sa tâche de découverte de nouvelles sources. Notre approche s'articule autour de la modélisation du besoin opérationnel et de l'exploration ciblée du Web. La modélisation du besoin informationnel permet de guider l'exploration du web pour découvrir et fournir des sources pertinentes à l'expert. The constant growth of the Web in recent years has made more difficult the discovery of new sources of information on a given topic. This is a prominent problem for Expert in Intelligence Analysis (EIA) who are faced with the search of pages on specific and sensitive topics. Because of their lack of popularity or because they are poorly indexed due to their sensitive content, these pages are hard to find with traditional search engine. In this article, we describe a new Web source discovery system called DOWSER. The goal of this system is to provide users with new sources of information related to their needs without considering the popularity of a page unlike classic Information Retrieval tools. The expected result is a balance between relevance and originality, in the sense that the wanted pages are not necessary popular. DOWSER in based on a user profile to focus its exploration of the Web in order to collect and index only related Web documents. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2014ISAM0011/document Noël, Romain 2014-10-17 Rouen, INSA Vercouter, Laurent |
collection |
NDLTD |
language |
fr |
sources |
NDLTD |
topic |
Exploration ciblée Recherche d'information Profil utilisateur Modélisation besoin informationnel Focused crawling Information retrieval Similarity measure User profile |
spellingShingle |
Exploration ciblée Recherche d'information Profil utilisateur Modélisation besoin informationnel Focused crawling Information retrieval Similarity measure User profile Noël, Romain Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel |
description |
L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifiques et sensibles. Ces pages non populaires sont souvent mal indexées ou non indexées par les moteurs de recherche à cause de leur contenu délicat, les rendant difficile à trouver. Nos travaux, qui s'inscrivent dans ce contenu du Renseignement d'Origine Source Ouverte (ROSO), visent à aider l'expert du renseignement dans sa tâche de découverte de nouvelles sources. Notre approche s'articule autour de la modélisation du besoin opérationnel et de l'exploration ciblée du Web. La modélisation du besoin informationnel permet de guider l'exploration du web pour découvrir et fournir des sources pertinentes à l'expert. === The constant growth of the Web in recent years has made more difficult the discovery of new sources of information on a given topic. This is a prominent problem for Expert in Intelligence Analysis (EIA) who are faced with the search of pages on specific and sensitive topics. Because of their lack of popularity or because they are poorly indexed due to their sensitive content, these pages are hard to find with traditional search engine. In this article, we describe a new Web source discovery system called DOWSER. The goal of this system is to provide users with new sources of information related to their needs without considering the popularity of a page unlike classic Information Retrieval tools. The expected result is a balance between relevance and originality, in the sense that the wanted pages are not necessary popular. DOWSER in based on a user profile to focus its exploration of the Web in order to collect and index only related Web documents. |
author2 |
Rouen, INSA |
author_facet |
Rouen, INSA Noël, Romain |
author |
Noël, Romain |
author_sort |
Noël, Romain |
title |
Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel |
title_short |
Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel |
title_full |
Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel |
title_fullStr |
Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel |
title_full_unstemmed |
Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel |
title_sort |
contribution à la veille stratégique : dowser, un système de découverte de sources web d’intérêt opérationnel |
publishDate |
2014 |
url |
http://www.theses.fr/2014ISAM0011/document |
work_keys_str_mv |
AT noelromain contributionalaveillestrategiquedowserunsystemededecouvertedesourceswebdinteretoperationnel AT noelromain buisnessintelligencecontributiondowserdiscoveringofwebsourcesevaluatingrelevance |
_version_ |
1718488676399316992 |