A SOFTWARE INFRASTRUCTURE FOR CATALOG MATCHING

COORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIOR === FUNDAÇÃO DE APOIO À PESQUISA DO ESTADO DO RIO DE JANEIRO === A maior parte dos bancos de dados existentes é projetada de maneira independente e, portanto, é geralmente implementada utilizando diferentes esquemas conceituais, criando...

Full description

Bibliographic Details
Main Author: ALEXANDRE GAZOLA
Other Authors: MARCO ANTONIO CASANOVA
Language:Portuguese
Published: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO 2008
Online Access:http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=11698@1
http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=11698@2
Description
Summary:COORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIOR === FUNDAÇÃO DE APOIO À PESQUISA DO ESTADO DO RIO DE JANEIRO === A maior parte dos bancos de dados existentes é projetada de maneira independente e, portanto, é geralmente implementada utilizando diferentes esquemas conceituais, criando um contexto de heterogeneidade em níveis sintático, estrutural e semântico. Não obstante, quando um conjunto de bancos de dados se refere a um mesmo domínio, eventualmente, surge a necessidade de integrá-los em um mesmo banco, ou de intermediar o acesso ao conjunto de bancos de forma transparente. Para tratar o problema da heterogeneidade, torna-se necessário o alinhamento dos esquemas de cada um dos bancos de dados envolvidos. Esse processo geralmente é feito por especialistas de domínio, mas tende a ser um trabalho muito tedioso e propenso a erros. Esta dissertação apresenta o CatalogMatcher, uma infra-estrutura de software para alinhamento de catálogos heterogêneos. Um catálogo armazena dados sobre um conjunto de objetos de um determinado domínio, tipicamente classificados por algum tipo de taxonomia ou tesauro. O CatalogMatcher contém componentes que implementam estratégias de alinhamento de catálogos heterogêneos utilizando abordagens baseadas em instâncias. === Most databases are independently designed and, therefore, are usually implemented using different conceptual schemas, which creates a context of syntactic, structural and semantic-level heterogeneity. Nevertheless, when a set of databases refers to a common domain, it may become necessary to integrate them into a single database, or to intermediate access to the databases in a transparent way. To deal with the heterogeneity problem, it becomes necessary to align the conceptual schemas. This process is usually carried out by domain specialists, and tends to be tedious and error-prone. This dissertation presents the CatalogMatcher, a software infrastructure for catalog matching. A catalog stores data about a set of objects from a specific domain, typically classified by some sort of taxonomy or thesaurus. The CatalogMatcher contains components that implement instance-based alignment strategies.