Explicitação de esquema orientada a contexto para promover interoperabilidade semântica

Orientador: André Santanchè === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação === Made available in DSpace on 2018-08-21T20:20:46Z (GMT). No. of bitstreams: 1 Bernardo_IvelizeRocha_M.pdf: 1642753 bytes, checksum: 79818a62ab275ff01db056b803beb9b6 (MD5) Previous...

Full description

Bibliographic Details
Main Author: Bernardo, Ivelize Rocha, 1982-
Other Authors: UNIVERSIDADE ESTADUAL DE CAMPINAS
Format: Others
Language:Portuguese
Published: [s.n.] 2012
Subjects:
Online Access:BERNARDO, Ivelize Rocha. Explicitação de esquema orientada a contexto para promover interoperabilidade semântica. 2012. 54 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275680>. Acesso em: 21 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/275680
id ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-275680
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Planilhas eletrônicas
Web semântica
Recuperação da informação
Biologia - Processamento de dados
Electronic spreadsheets
Semantic Web
Information retrieval
Biology - Data processing
spellingShingle Planilhas eletrônicas
Web semântica
Recuperação da informação
Biologia - Processamento de dados
Electronic spreadsheets
Semantic Web
Information retrieval
Biology - Data processing
Bernardo, Ivelize Rocha, 1982-
Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
description Orientador: André Santanchè === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação === Made available in DSpace on 2018-08-21T20:20:46Z (GMT). No. of bitstreams: 1 Bernardo_IvelizeRocha_M.pdf: 1642753 bytes, checksum: 79818a62ab275ff01db056b803beb9b6 (MD5) Previous issue date: 2012 === Resumo: A flexibilidade proporcionada por planilhas eletrônicas possibilita sua customização seguindo modelos mentais de seus autores e as tornam sistemas populares de gerenciamento de dados. Gradativamente tem crescido a necessidade de se integrar e articular dados de diferentes planilhas e, para que máquinas possam auxiliar neste processo, o desafio é como interpretar automaticamente o seu esquema implícito, que é dirigido à interpretação humana. Alguns trabalhos propõem o mapeamento do conteúdo das planilhas para padrões abertos de interoperabilidade, principalmente aqueles da Web Semântica. A principal limitação destes trabalhos consiste no pressuposto de que é possível reconhecer e explicitar os esquemas e a semântica das planilhas automaticamente, independentemente do seu domínio. Este trabalho se diferencia por considerar o contexto e o domínio em que foram concebidas as planilhas essenciais para se traçar o conjunto de práticas compartilhadas pela comunidade em questão, que estabelece padrões de construção a serem reconhecidos automaticamente por nosso sistema, em um processo de extração de dados e explicitação de esquemas. Nossa proposta envolve uma estratégia para caracterização de padrões de construção associados a modelos conceituais de autores na construção de planilhas, que é resultado de uma ampla pesquisa de práticas compartilhadas por autores de planilhas no domínio de uso da Biologia. Neste documento apresentamos o resultado de um experimento prático envolvendo tal sistema, no qual integramos os dados de centenas de planilhas eletrônicas disponíveis na Web. Tal integração foi possível pela capacidade única de nossa abordagem de reconhecer a natureza da planilha analisada dentro de seu contexto de criação === Abstract: The flexibility provided by spreadsheets allows their customization following mental models of their authors and makes them popular data management systems. Gradually there is a growing need of integrating and join data from different spreadsheets and, to enable machines assistance in this process, the challenge is how to automatically interpret their implicit schema, which is addressed to human interpretation. In this sense, some related works propose mapping spreadsheets contents to open interoperability standards, mainly Semantic Web standards. The main limitation of such proposals is the assumption that it is possible to recognize and make explicit the schema and the semantics of spreadsheets automatically apart from their domain. This work differs by assuming the essential role of the context and the domain in which the spreadsheet was conceived to delineate shared practices of the community, which establishes building patterns to be automatically recognized by our system, in data extraction process and schema recognition. Our proposal involves a strategy to characterize building patterns related to conceptual models of authors in spreadsheets building process, which results from an extensive research of practices shared among authors of spreadsheets in the Biology usage domain. In this document we present a result of a practical experiment involving such a system, in which we integrated data from hundreds of spreadsheets available on the Web. This integration was possible due to a unique ability of our approach of recognizing the spreadsheet nature analyzed inside its creation context === Mestrado === Ciência da Computação === Mestra em Ciência da Computação
author2 UNIVERSIDADE ESTADUAL DE CAMPINAS
author_facet UNIVERSIDADE ESTADUAL DE CAMPINAS
Bernardo, Ivelize Rocha, 1982-
author Bernardo, Ivelize Rocha, 1982-
author_sort Bernardo, Ivelize Rocha, 1982-
title Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
title_short Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
title_full Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
title_fullStr Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
title_full_unstemmed Explicitação de esquema orientada a contexto para promover interoperabilidade semântica
title_sort explicitação de esquema orientada a contexto para promover interoperabilidade semântica
publisher [s.n.]
publishDate 2012
url BERNARDO, Ivelize Rocha. Explicitação de esquema orientada a contexto para promover interoperabilidade semântica. 2012. 54 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275680>. Acesso em: 21 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/275680
work_keys_str_mv AT bernardoivelizerocha1982 explicitacaodeesquemaorientadaacontextoparapromoverinteroperabilidadesemantica
AT bernardoivelizerocha1982 promotingsemanticinteroperabilitybyacontextorientedapproachtomakeschemasexplicit
_version_ 1718882959087370240
spelling ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-2756802019-01-21T21:19:14Z Explicitação de esquema orientada a contexto para promover interoperabilidade semântica Promoting semantic interoperability by a context oriented approach to make schemas explicit Bernardo, Ivelize Rocha, 1982- UNIVERSIDADE ESTADUAL DE CAMPINAS Santanchè, André, 1968- David, José Maria Nazar Baranauskas, Maria Cecilia Calani Planilhas eletrônicas Web semântica Recuperação da informação Biologia - Processamento de dados Electronic spreadsheets Semantic Web Information retrieval Biology - Data processing Orientador: André Santanchè Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Made available in DSpace on 2018-08-21T20:20:46Z (GMT). No. of bitstreams: 1 Bernardo_IvelizeRocha_M.pdf: 1642753 bytes, checksum: 79818a62ab275ff01db056b803beb9b6 (MD5) Previous issue date: 2012 Resumo: A flexibilidade proporcionada por planilhas eletrônicas possibilita sua customização seguindo modelos mentais de seus autores e as tornam sistemas populares de gerenciamento de dados. Gradativamente tem crescido a necessidade de se integrar e articular dados de diferentes planilhas e, para que máquinas possam auxiliar neste processo, o desafio é como interpretar automaticamente o seu esquema implícito, que é dirigido à interpretação humana. Alguns trabalhos propõem o mapeamento do conteúdo das planilhas para padrões abertos de interoperabilidade, principalmente aqueles da Web Semântica. A principal limitação destes trabalhos consiste no pressuposto de que é possível reconhecer e explicitar os esquemas e a semântica das planilhas automaticamente, independentemente do seu domínio. Este trabalho se diferencia por considerar o contexto e o domínio em que foram concebidas as planilhas essenciais para se traçar o conjunto de práticas compartilhadas pela comunidade em questão, que estabelece padrões de construção a serem reconhecidos automaticamente por nosso sistema, em um processo de extração de dados e explicitação de esquemas. Nossa proposta envolve uma estratégia para caracterização de padrões de construção associados a modelos conceituais de autores na construção de planilhas, que é resultado de uma ampla pesquisa de práticas compartilhadas por autores de planilhas no domínio de uso da Biologia. Neste documento apresentamos o resultado de um experimento prático envolvendo tal sistema, no qual integramos os dados de centenas de planilhas eletrônicas disponíveis na Web. Tal integração foi possível pela capacidade única de nossa abordagem de reconhecer a natureza da planilha analisada dentro de seu contexto de criação Abstract: The flexibility provided by spreadsheets allows their customization following mental models of their authors and makes them popular data management systems. Gradually there is a growing need of integrating and join data from different spreadsheets and, to enable machines assistance in this process, the challenge is how to automatically interpret their implicit schema, which is addressed to human interpretation. In this sense, some related works propose mapping spreadsheets contents to open interoperability standards, mainly Semantic Web standards. The main limitation of such proposals is the assumption that it is possible to recognize and make explicit the schema and the semantics of spreadsheets automatically apart from their domain. This work differs by assuming the essential role of the context and the domain in which the spreadsheet was conceived to delineate shared practices of the community, which establishes building patterns to be automatically recognized by our system, in data extraction process and schema recognition. Our proposal involves a strategy to characterize building patterns related to conceptual models of authors in spreadsheets building process, which results from an extensive research of practices shared among authors of spreadsheets in the Biology usage domain. In this document we present a result of a practical experiment involving such a system, in which we integrated data from hundreds of spreadsheets available on the Web. This integration was possible due to a unique ability of our approach of recognizing the spreadsheet nature analyzed inside its creation context Mestrado Ciência da Computação Mestra em Ciência da Computação 2012 2018-08-21T20:20:46Z 2018-08-21T20:20:46Z 2012-04-09T00:00:00Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis BERNARDO, Ivelize Rocha. Explicitação de esquema orientada a contexto para promover interoperabilidade semântica. 2012. 54 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275680>. Acesso em: 21 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/275680 por info:eu-repo/semantics/openAccess 54 f. : il. application/octet-stream [s.n.] Universidade Estadual de Campinas. Instituto de Computação Programa de Pós-Graduação em Ciência da Computação reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP