Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
Orientador: André Santanchè === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação === Made available in DSpace on 2018-08-21T20:20:46Z (GMT). No. of bitstreams: 1 Bernardo_IvelizeRocha_M.pdf: 1642753 bytes, checksum: 79818a62ab275ff01db056b803beb9b6 (MD5) Previous...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
[s.n.]
2012
|
Subjects: | |
Online Access: | BERNARDO, Ivelize Rocha. Explicitação de esquema orientada a contexto para promover interoperabilidade semântica. 2012. 54 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275680>. Acesso em: 21 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/275680 |
Summary: | Orientador: André Santanchè === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação === Made available in DSpace on 2018-08-21T20:20:46Z (GMT). No. of bitstreams: 1
Bernardo_IvelizeRocha_M.pdf: 1642753 bytes, checksum: 79818a62ab275ff01db056b803beb9b6 (MD5)
Previous issue date: 2012 === Resumo: A flexibilidade proporcionada por planilhas eletrônicas possibilita sua customização seguindo modelos mentais de seus autores e as tornam sistemas populares de gerenciamento de dados. Gradativamente tem crescido a necessidade de se integrar e articular dados de diferentes planilhas e, para que máquinas possam auxiliar neste processo, o desafio é como interpretar automaticamente o seu esquema implícito, que é dirigido à interpretação humana. Alguns trabalhos propõem o mapeamento do conteúdo das planilhas para padrões abertos de interoperabilidade, principalmente aqueles da Web Semântica. A principal limitação destes trabalhos consiste no pressuposto de que é possível reconhecer e explicitar os esquemas e a semântica das planilhas automaticamente, independentemente do seu domínio. Este trabalho se diferencia por considerar o contexto e o domínio em que foram concebidas as planilhas essenciais para se traçar o conjunto de práticas compartilhadas pela comunidade em questão, que estabelece padrões de construção a serem reconhecidos automaticamente por nosso sistema, em um processo de extração de dados e explicitação de esquemas. Nossa proposta envolve uma estratégia para caracterização de padrões de construção associados a modelos conceituais de autores na construção de planilhas, que é resultado de uma ampla pesquisa de práticas compartilhadas por autores de planilhas no domínio de uso da Biologia. Neste documento apresentamos o resultado de um experimento prático envolvendo tal sistema, no qual integramos os dados de centenas de planilhas eletrônicas disponíveis na Web. Tal integração foi possível pela capacidade única de nossa abordagem de reconhecer a natureza da planilha analisada dentro de seu contexto de criação === Abstract: The flexibility provided by spreadsheets allows their customization following mental models of their authors and makes them popular data management systems. Gradually there is a growing need of integrating and join data from different spreadsheets and, to enable machines assistance in this process, the challenge is how to automatically interpret their implicit schema, which is addressed to human interpretation. In this sense, some related works propose mapping spreadsheets contents to open interoperability standards, mainly Semantic Web standards. The main limitation of such proposals is the assumption that it is possible to recognize and make explicit the schema and the semantics of spreadsheets automatically apart from their domain. This work differs by assuming the essential role of the context and the domain in which the spreadsheet was conceived to delineate shared practices of the community, which establishes building patterns to be automatically recognized by our system, in data extraction process and schema recognition. Our proposal involves a strategy to characterize building patterns related to conceptual models of authors in spreadsheets building process, which results from an extensive research of practices shared among authors of spreadsheets in the Biology usage domain. In this document we present a result of a practical experiment involving such a system, in which we integrated data from hundreds of spreadsheets available on the Web. This integration was possible due to a unique ability of our approach of recognizing the spreadsheet nature analyzed inside its creation context === Mestrado === Ciência da Computação === Mestra em Ciência da Computação |
---|