Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes

A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de bu...

Full description

Bibliographic Details
Main Author: Araújo, Charles Henrique de
Other Authors: Wyse, Angela Terezinha de Souza
Format: Others
Language:Portuguese
Published: 2017
Subjects:
Online Access:http://hdl.handle.net/10183/151305
id ndltd-IBICT-oai-lume.ufrgs.br-10183-151305
record_format oai_dc
spelling ndltd-IBICT-oai-lume.ufrgs.br-10183-1513052018-10-22T04:42:25Z Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes Araújo, Charles Henrique de Wyse, Angela Terezinha de Souza Vocabulário controlado Sistemas de recomendação Recuperação da informação Ciências da saúde Query expansion Data mining Recommendation systems A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq. Information retrieval in large databases need increasingly more efficient ways for accomplishing this task. There are many problems, like spelling, language, synonym, acronyms, lack of standardization of terms, both in the search arguments, as in the indexing of documents. They directly interfere in the results. Thus, this study aimed to evaluate the impact of the addition of structured vocabularies of Health Sciences area in Lattes Database, in the recovery of similar profiles of researchers that work in Biological Sciences and Health Sciences, using Query Expansion, Data Mining procedures, Vector Models and Trigram Phrase Matching algorithm. Crosschecking keywords of articles registered in Lattes Database and Medical Subject Headings (MeSH) and Health Sciences Descriptors (DeCS) terms, as well as comparisons between the results of queries using the original keywords and adding them to query expansion terms. The results show that the methodology used in this study can qualitatively increase the set of recovered profiles, contributing to the improvement of CNPq Information Systems. 2017-01-27T02:19:17Z 2016 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10183/151305 001011132 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Vocabulário controlado
Sistemas de recomendação
Recuperação da informação
Ciências da saúde
Query expansion
Data mining
Recommendation systems
spellingShingle Vocabulário controlado
Sistemas de recomendação
Recuperação da informação
Ciências da saúde
Query expansion
Data mining
Recommendation systems
Araújo, Charles Henrique de
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
description A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq. === Information retrieval in large databases need increasingly more efficient ways for accomplishing this task. There are many problems, like spelling, language, synonym, acronyms, lack of standardization of terms, both in the search arguments, as in the indexing of documents. They directly interfere in the results. Thus, this study aimed to evaluate the impact of the addition of structured vocabularies of Health Sciences area in Lattes Database, in the recovery of similar profiles of researchers that work in Biological Sciences and Health Sciences, using Query Expansion, Data Mining procedures, Vector Models and Trigram Phrase Matching algorithm. Crosschecking keywords of articles registered in Lattes Database and Medical Subject Headings (MeSH) and Health Sciences Descriptors (DeCS) terms, as well as comparisons between the results of queries using the original keywords and adding them to query expansion terms. The results show that the methodology used in this study can qualitatively increase the set of recovered profiles, contributing to the improvement of CNPq Information Systems.
author2 Wyse, Angela Terezinha de Souza
author_facet Wyse, Angela Terezinha de Souza
Araújo, Charles Henrique de
author Araújo, Charles Henrique de
author_sort Araújo, Charles Henrique de
title Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_short Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_full Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_fullStr Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_full_unstemmed Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_sort estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no currículo lattes
publishDate 2017
url http://hdl.handle.net/10183/151305
work_keys_str_mv AT araujocharleshenriquede estudosobreoimpactodaadicaodevocabulariosestruturadosdaareadecienciasdasaudenocurriculolattes
_version_ 1718784992487669760