Ontologia como recurso de padronização terminológica no processo de recuperação de informação

O processo de recuperação de informação envolve um acervo documental que deve ser representado por expressões linguísticas e usuários que tentam descrever linguisticamente as suas necessidades de informação a fim de obterem documentos relevantes para satisfazer tais necessidades. Um sistema de recup...

Full description

Bibliographic Details
Main Authors: Jorge Janaite Neto, Edberto Ferneda
Format: Article
Language:English
Published: Departamento de Ciência da Informação 2016-06-01
Series:Informação em Pauta
Subjects:
Online Access:http://periodicos.ufc.br/informacaoempauta/article/view/2967
Description
Summary:O processo de recuperação de informação envolve um acervo documental que deve ser representado por expressões linguísticas e usuários que tentam descrever linguisticamente as suas necessidades de informação a fim de obterem documentos relevantes para satisfazer tais necessidades. Um sistema de recuperação de informação é, portanto, um ambiente linguístico mediador na comunicação entre um estoque de informação e seus requisitantes. Sua eficiência depende de um controle adequado da linguagem de representação dos itens de informação e das requisições dos usuários. Este trabalho apresenta um método de utilização de ontologias na recuperação de informação. Utiliza-se o Modelo Espaço Vetorial como estrutura formal para a representação dos documentos e das buscas dos usuários. Os vetores dos documentos são criados durante o processo de indexação automática no qual uma ontologia fornece novos termos além daqueles extraídos do texto, enriquecendo, assim a representação do documento. O vetor de busca é criado a partir de um processo de expansão de consulta no qual, a partir de inferências em uma ontologia, novos termos são inseridos na expressão de busca inicialmente formulada pelo usuário. Pretende-se com isso uniformizar as representações dos documentos e das buscas, melhorando assim a precisão do processo de recuperação de informação.
ISSN:2525-3468