Summary: | Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-04-17T14:18:29Z
No. of bitstreams: 2
TESE Neide Ferreira Alves .pdf: 4496625 bytes, checksum: 5673d5cd06a3ba049f1bdaec261136d6 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) === Made available in DSpace on 2015-04-17T14:18:29Z (GMT). No. of bitstreams: 2
TESE Neide Ferreira Alves .pdf: 4496625 bytes, checksum: 5673d5cd06a3ba049f1bdaec261136d6 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-08-16 === A presente tese descreve as especificações e requisitos para o desenvolvimento de
Bibliotecas Digitais de documentos textuais, considerando a possibilidade de reuso e a
extração de dados. Considerando o imenso volume de informação disponível nesses
repositórios, é de grande interesse a construção de sistemas capazes de selecionar
automaticamente apenas os dados de interesse do usuário, facilitando assim o acesso, a
manipulação e a divulgação dessas informações. O Modelo de Referências de Biblioteca
Digital da DELOS foi utilizado para guiar a construção do ambiente, como consequência
foi desenvolvida a plataforma pLiveMemory com módulos implementados para desktop e
web, neste último, a infraestrutura da nuvem do Google é utilizada. Entre os módulos
desenvolvidos há um específico para identificação e extração de referências bibliográficas,
o qual usa, entre outros, o algoritmo de Naïve Bayes juntamente com as técnicas de
expressões regulares. Também há um módulo para identificação de palavras-chave em
arquivos de formato PDF editável. Os resultados obtidos mostraram os ganhos com a
utilização das estratégias adotadas nas diversas fases do projeto, como na classificação
automática de informação dos textos de artigos científicos.
|