Summary: | Keyword searching (e.g., Google or Yahoo!) is based on uncontrolled vocabulary matching which often produces large and noisy result sets. This can waste the time of the searcher who has to sift through long lists of often irrelevant information. The Semantic Web initiative aims to address this issue and includes the description of content using controlled ontologies (i.e., sets of descriptive terms and their relations). Ontologies are partly hierarchical structures too large to display on a single computer screen and thus difficult for searchers to explore efficiently. In an attempt to address these issues, this research has developed and tested Subject Explorer 3D (SE-3D): an information visualization (IV) virtual reality (VR) information retrieval (IR) application based on the metaphor of exploring a physical space. SE-3D aimed to facilitate the visual exploration of information by offering searchers an interactive representation of the subject structure found in the Library of Congress Subject Headings (LCSH). SE-3D is a visual subject ontology navigation tool integrated with keyword searching and relevance ranking of a realworld information collection.SE-3D was tested by 24 undergraduate students during a repeated measures within-subject experiment. As compared with a text-only baseline, SE-3D produced an advantage in accuracy. Participants were more patient with SE-3D, they preferred it and perceived it as more useful. The application used a new technique to manage hundreds of overlapping textual labels in virtual reality, and offered a novel integration of explorative and specific keyword searching. The analysis of the collection revealed that subject assignments followed a power law; the top 1% most assigned subjects contained over 58% of the collection and 65% of non-empty subjects contained a single document.The findings suggest it is possible to extract additional value from organized collections by offering untrained users a reconstructed subject structure integrated with keyword searching. This research is significant for the development and testing of improved bridges between information organization and IR, and interactive information visualization. === La recherche d'information textuelle à l'aide de mots clés (e.g., Google, Yahoo!) est basée sur la correspondance du vocabulaire utilisé et produit souvent de nombreux résultats à faible pertinence. Le chercheur perd son temps à examiner de longues listes de résultats contenant beaucoup d'information sans rapport avec le sujet. L'initiative du Web sémantique a pour objectif de pallier à ce problème en décrivant l'information à l'aide d'ontologies contrôlées (c.-à-d. des ensembles de termes descriptifs et leurs relations). Toutes les ontologies sont en partie de vastes structures hiérarchiques trop grandes pour être affichées à l'écran, elles sont donc difficiles à explorer de façon efficiente.Développé dans le cadre de cette recherche, le Subject Explorer 3D (SE-3D) est un logiciel de visualisation de l'information (VI) en réalité virtuelle (RV) basé sur une métaphore d'exploration de l'espace physique. SE-3D tente de faciliter l'exploration visuelle de l'information en offrant aux chercheurs une représentation visuelle de la structure des vedettes-matières de la bibliothèque du Congrès (LCSH). SE-3D est un outil visuel de navigation d'ontologies sémantiques fortement intégrés avec la recherche par mots clés et le classement par pertinence d'une réelle collection d'information.SE-3D a été testé par 24 étudiants au baccalauréat durant une expérience à mesures répétées intra-sujet. En comparaison avec un système purement textuel équivalent, SE-3D a produit une plus grande précision. Les participants se sont révélés plus patients avec SE-3D, ils l'ont préféré et perçu comme étant plus utile. SE-3D utilise une nouvelle technique de gestion des chevauchements entre étiquettes textuelles en RV, et offre une intégration novatrice de la recherche par mots clés permettant de filtrer la structure sémantique. L'analyse de la collection a démontrée que les affectations des termes LCSH au sein de la collection suivent une loi de puissance. Par exemple, 1% des sujets les plus affectés contiennent plus de 58% de la collection, et 65% des sujets non vides contiennent un seul document.Ces résultats suggèrent qu'il est possible d'extraire une valeur ajouté provenant des collections organisées en offrant aux utilisateurs novices une structure sémantique reconstruite intégrée avec la recherche par mot clé. Cette recherche est significative pour le développement de ponts entre les structures d'organisation de l'information et la recherche d'information, ainsi que la visualisation de l'information interactive.
|