Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)

Made available in DSpace on 2014-06-11T19:26:44Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-06-22Bitstream added on 2014-06-13T19:13:58Z : No. of bitstreams: 1 narukawa_cm_me_mar.pdf: 1418357 bytes, checksum: 7e98e9c87bc1140142e22bd52dcd3e05 (MD5) === A indexação automática é um process...

Full description

Bibliographic Details
Main Author: Narukawa, Cristina Miyuki [UNESP]
Other Authors: Universidade Estadual Paulista (UNESP)
Format: Others
Language:Portuguese
Published: Universidade Estadual Paulista (UNESP) 2014
Subjects:
Online Access:http://hdl.handle.net/11449/93677
id ndltd-IBICT-oai-repositorio.unesp.br-11449-93677
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Ciência da informação
Indexação automatica
Sistemas de recuperação da informação
Sistema de indización semiautomática (SISA)
Linguagem de indexação
Indexação - Software
Vocabulário controlado
Automatic indexing
Controlled vocabulary
Automatic Indexing Systems
Sistema de Indización Semiautomático (SISA)
spellingShingle Ciência da informação
Indexação automatica
Sistemas de recuperação da informação
Sistema de indización semiautomática (SISA)
Linguagem de indexação
Indexação - Software
Vocabulário controlado
Automatic indexing
Controlled vocabulary
Automatic Indexing Systems
Sistema de Indización Semiautomático (SISA)
Narukawa, Cristina Miyuki [UNESP]
Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
description Made available in DSpace on 2014-06-11T19:26:44Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-06-22Bitstream added on 2014-06-13T19:13:58Z : No. of bitstreams: 1 narukawa_cm_me_mar.pdf: 1418357 bytes, checksum: 7e98e9c87bc1140142e22bd52dcd3e05 (MD5) === A indexação automática é um processo complexo e delegar a atividade de atribuição de termos aos sistemas automáticos requer análise, tanto dos métodos, quanto das características dos instrumentos de indexação. Desse modo, propomos investigar a atuação de vocabulário controlado neste processo a partir da análise dos resultados de aplicação do vocabulário ThesAgro no Sistema de Indización SemiAutomatica (SISA), com objetivos de identificar as características que definem e distinguem os tipos de vocabulários; analisar propostas metodológicas e sistemas de indexação; aplicar o ThesAgro no sistema SISA em análise comparativa com a indexação manual da Biblioteca Nacional de Agricultura (BINAGRI), e analisar os fatores intervenientes que apontam os problemas ocasionados à indexação automática. De modo geral, buscamos contribuir com o desenvolvimento do tema ao levantar subsídios para adaptação de vocabulários controlados. Realizamos uma revisão teórica sobre sistemas de indexação automática e um experimento aplicando o ThesAgro no sistema SISA com 100 artigos da área agrícola, especificamente sobre fruticultura. Utilizamos, como parâmetro de avaliação, a indexação manual realizada pela BINAGRI e análise comparativa com os resultados de pesquisa anterior em que se avaliou o desempenho do vocabulário Descritores em Ciências da Saúde (DeCS) no referido sistema. A partir da análise dos resultados constatamos que o vocabulário condiciona os resultados do processo de indexação automática e, portanto, é necessário compreendê-lo, considerando os métodos de identificação das unidades representativas da informação, aplicação de tratamento linguístico, características da área do conhecimento, relações semânticas, idioma, atualização, uso de vocabulários... === Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below)
author2 Universidade Estadual Paulista (UNESP)
author_facet Universidade Estadual Paulista (UNESP)
Narukawa, Cristina Miyuki [UNESP]
author Narukawa, Cristina Miyuki [UNESP]
author_sort Narukawa, Cristina Miyuki [UNESP]
title Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_short Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_full Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_fullStr Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_full_unstemmed Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA)
title_sort estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do sistema de indización semiautomática (sisa)
publisher Universidade Estadual Paulista (UNESP)
publishDate 2014
url http://hdl.handle.net/11449/93677
work_keys_str_mv AT narukawacristinamiyukiunesp estudodevocabulariocontroladonaindexacaoautomaticaaplicacaonoprocessodeindexacaodosistemadeindizacionsemiautomaticasisa
_version_ 1718654419432636416
spelling ndltd-IBICT-oai-repositorio.unesp.br-11449-936772018-05-23T20:25:10Z Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA) Narukawa, Cristina Miyuki [UNESP] Universidade Estadual Paulista (UNESP) Fujita, Mariângela Spotti Lopes [UNESP] Leiva, Isidoro Gil [UNESP] Ciência da informação Indexação automatica Sistemas de recuperação da informação Sistema de indización semiautomática (SISA) Linguagem de indexação Indexação - Software Vocabulário controlado Automatic indexing Controlled vocabulary Automatic Indexing Systems Sistema de Indización Semiautomático (SISA) Made available in DSpace on 2014-06-11T19:26:44Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-06-22Bitstream added on 2014-06-13T19:13:58Z : No. of bitstreams: 1 narukawa_cm_me_mar.pdf: 1418357 bytes, checksum: 7e98e9c87bc1140142e22bd52dcd3e05 (MD5) A indexação automática é um processo complexo e delegar a atividade de atribuição de termos aos sistemas automáticos requer análise, tanto dos métodos, quanto das características dos instrumentos de indexação. Desse modo, propomos investigar a atuação de vocabulário controlado neste processo a partir da análise dos resultados de aplicação do vocabulário ThesAgro no Sistema de Indización SemiAutomatica (SISA), com objetivos de identificar as características que definem e distinguem os tipos de vocabulários; analisar propostas metodológicas e sistemas de indexação; aplicar o ThesAgro no sistema SISA em análise comparativa com a indexação manual da Biblioteca Nacional de Agricultura (BINAGRI), e analisar os fatores intervenientes que apontam os problemas ocasionados à indexação automática. De modo geral, buscamos contribuir com o desenvolvimento do tema ao levantar subsídios para adaptação de vocabulários controlados. Realizamos uma revisão teórica sobre sistemas de indexação automática e um experimento aplicando o ThesAgro no sistema SISA com 100 artigos da área agrícola, especificamente sobre fruticultura. Utilizamos, como parâmetro de avaliação, a indexação manual realizada pela BINAGRI e análise comparativa com os resultados de pesquisa anterior em que se avaliou o desempenho do vocabulário Descritores em Ciências da Saúde (DeCS) no referido sistema. A partir da análise dos resultados constatamos que o vocabulário condiciona os resultados do processo de indexação automática e, portanto, é necessário compreendê-lo, considerando os métodos de identificação das unidades representativas da informação, aplicação de tratamento linguístico, características da área do conhecimento, relações semânticas, idioma, atualização, uso de vocabulários... Automatic indexing is a complex process, and delegating the attribution of terms to automatic systems requires analyzing not only the methods, but also the features of indexing instruments. Thereby, we propose to investigate the role of controlled vocabulary in such process, based on the analysis of results from the application of ThesAgro vocabulary in the Semi-Automatic Indexing System (SISA - Sistema de Indización SemiAutomatica -), with the purposes of identifying the characteristics which define and distinguish the types of vocabularies; analyzing methodological proposals and indexing systems; applying the ThesAgro in the SISA, making a comparative analysis related to the manual indexing by the National Library of Agriculture (BINAGRI - Biblioteca Nacional de Agricultura), and analyzing the intervening factors pointing to the occurrence of problems concerning automatic indexing. As a general matter, we seek to contribute to the development of this theme by raising subsidies for adapting controlled vocabularies. We have performed a theoretical review on automatic indexing systems, and an experiment applying the ThesAgro in the SISA, with 100 articles on agriculture , specifically about fruit production. The manual indexing performed by BINAGRI and the comparative analysis with the results from a previous research, which evaluated the performance of the vocabulary from the Health Sciences Descriptors (DeCS - Descritores em Ciências da Saúde) in the before mentioned system, have served as the evaluation parameter. The analysis of results allows us to conclude that the vocabulary conditions the results of the automatic indexing process. Thus, it is necessary to understand it, considering the identification methods of the information representative units, application of linguistic treatment, features of the... (Complete abstract click electronic access below) 2014-06-11T19:26:44Z 2014-06-11T19:26:44Z 2011-06-22 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis NARUKAWA, Cristina Miyuki. Estudo de vocabulário controlado na indexação automática: aplicação no processo de indexação do Sistema de Indización Semiautomática (SISA). 2011. 222 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Filosofia e Ciências, 2011. http://hdl.handle.net/11449/93677 000670832 narukawa_cm_me_mar.pdf 33004110043P4 6530346906709462 por -1 -1 -1 info:eu-repo/semantics/openAccess 222 f. : il. color. Universidade Estadual Paulista (UNESP) Aleph reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista instacron:UNESP