Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia

O Hemocentro São Paulo é responsável por manter um banco de dados com informações sobre cada doação ou tentativa de doação de sangue. No entanto, os dados desse banco de dados não possuem a qualidade requerida pelas ferramentas/técnicas de análise. Por essa razão, fica difícil utilizar tais dados pa...

Full description

Bibliographic Details
Main Author: Almeida, Fernanda Nascimento
Other Authors: Ferreira, João Eduardo
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2012
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04092012-134137/
id ndltd-usp.br-oai-teses.usp.br-tde-04092012-134137
record_format oai_dc
collection NDLTD
language pt
format Others
sources NDLTD
topic anemia
anemia
blood donors
data provenance
doação de sangue total.
doadores de sangue
experimentos in silico
in silico experiments
proveniência de dados
whole blood donations.
spellingShingle anemia
anemia
blood donors
data provenance
doação de sangue total.
doadores de sangue
experimentos in silico
in silico experiments
proveniência de dados
whole blood donations.
Almeida, Fernanda Nascimento
Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
description O Hemocentro São Paulo é responsável por manter um banco de dados com informações sobre cada doação ou tentativa de doação de sangue. No entanto, os dados desse banco de dados não possuem a qualidade requerida pelas ferramentas/técnicas de análise. Por essa razão, fica difícil utilizar tais dados para estabelecer relações sistemáticas entre as variáveis armazenadas. A principal contribuição desta tese é a descrição da proveniência para atributos selecionados usando critérios de classificação definidos por especialistas. Este trabalho mostra que é possível fazer investigações detalhadas usando a descrição dos dados sem a necessidade de alterar a estrutura do banco de dados. Durante o período de 1996 a 2006, 1.469.505 doadores foram responsáveis por mais de 2.8 milhões de doações. Após a descrição da proveniência, foram obtidos 252.301 doadores do sexo masculino e 133.056 doadores do sexo feminino e que atenderam aos critérios de inclusão usados nesta tese. Dos 385.357 doadores incluídos na análise, 21.954 (5,7%) tiveram suas doações adiadas devido a seus baixos níveis de hematócrito, 3.850 (1,5%) eram do sexo masculino e 18.104 (13,6%) do sexo feminino. Os resultados obtidos demonstram que, embora os intervalos de espera entre as doações de sangue sejam grandes entre os doadores do sexo feminino e masculino, as mulheres são recusadas mais cedo, por risco de desenvolver anemia, do que os homens. Aproximadamente 12,84% das mulheres e 1,21% dos homens desenvolveriam hematócrito baixo antes da sétima doação. Os dados sugerem que indivíduos com baixo nível de hematócrito devem esperar mais tempo antes de executarem a próxima doação. Portanto, é importante compreender se existe uma ligação entre a doação de sangue e a diminuição no nível de hematócrito, a fim de evitar resultados indesejáveis para os doadores de sangue. O modelo de proveniência apresentado nesta tese não foi definido de acordo com os modelos de proveniência genéricos já implementados. Esta tese apresenta um modelo de proveniência que foi capaz de acrescentar informações semânticas para adquirir conhecimento de um experimento in silico. Um dos principais objetivos foi desenvolver uma abordagem baseada em declarações, tentando responder a importantes questionamentos biológicos. O modelo descrito combina ricas informações em cada processo usando declarações, e se baseia no conhecimento de especialistas. Esta tese também utilizou estatística descritiva e Análise de Sobrevivência. Finalmente, com a validação do modelo em um domínio conhecido, é pretendido expandir esse método para outros sistemas de informação voltados para hemoterapia. === The São Paulo Blood Center is responsible to maintain a database with information on each donation. However, this database does not have the quality required by techniques of analysis. For this reason, it is difficult to use it directly to establish systematic relationships between the variables. The main contribution of this paper is a provenance description of attributes selected using classification criteria defined by specialists. We show that it is possible to make detailed investigations using the data description without the need to change the structure of the database. During 1996 2006, 1,469,505 donors were responsible for more than 2.8 million of donation. After the provenance description, we obtained 252,301 male and 133,056 female that met our inclusion criteria. Of the 385,357 donors included in the analysis, 21,954(5.7%) were deferred due to low hematocrit, 3,850(1.5%) were males and 18,104(13.6%) were females. Our results show that, although the intervals between donations for female and male donors are wider, women presented anemia earlier than men. Approximately 12,84% of the females and 1,21% of the males would develop low hematocrit before the 7th donation. Our data suggest that individuals with low hematocrit level should wait longer before the next donation. Therefore, it is important to understand if there is a connection between blood donation and decrease in hematocrit level in order to prevent undesirable outcomes to blood donors. The provenance model presented here was not defined according to the generic provenance models already implemented. This thesis presents a provenance model that is able to add semantic information to acquire knowledge of an in silico experiment. One of the main purposes is to develop an approach based on declarations in order to answer biological questions. The provenance model described in this paper combines rich information for each process using the declarations, each having expert knowledge as a basis. To evaluate this provenance model we use descriptive statistics and Survival Analysis. Finally, with the validation of the model in a known domain, we intent to apply and validate this provenance model to other hemotherapy information systems.
author2 Ferreira, João Eduardo
author_facet Ferreira, João Eduardo
Almeida, Fernanda Nascimento
author Almeida, Fernanda Nascimento
author_sort Almeida, Fernanda Nascimento
title Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
title_short Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
title_full Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
title_fullStr Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
title_full_unstemmed Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
title_sort descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2012
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04092012-134137/
work_keys_str_mv AT almeidafernandanascimento descricaodaprovenienciadedadosparaextracaodeconhecimentoemsistemasdeinformacaodehemoterapia
AT almeidafernandanascimento provenancedescriptiontoextractknowledgefromhemotherapyinformationsystems
_version_ 1719051809157283840
spelling ndltd-usp.br-oai-teses.usp.br-tde-04092012-1341372019-05-09T17:58:14Z Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia Provenance Description to Extract Knowledge from Hemotherapy Information Systems Almeida, Fernanda Nascimento anemia anemia blood donors data provenance doação de sangue total. doadores de sangue experimentos in silico in silico experiments proveniência de dados whole blood donations. O Hemocentro São Paulo é responsável por manter um banco de dados com informações sobre cada doação ou tentativa de doação de sangue. No entanto, os dados desse banco de dados não possuem a qualidade requerida pelas ferramentas/técnicas de análise. Por essa razão, fica difícil utilizar tais dados para estabelecer relações sistemáticas entre as variáveis armazenadas. A principal contribuição desta tese é a descrição da proveniência para atributos selecionados usando critérios de classificação definidos por especialistas. Este trabalho mostra que é possível fazer investigações detalhadas usando a descrição dos dados sem a necessidade de alterar a estrutura do banco de dados. Durante o período de 1996 a 2006, 1.469.505 doadores foram responsáveis por mais de 2.8 milhões de doações. Após a descrição da proveniência, foram obtidos 252.301 doadores do sexo masculino e 133.056 doadores do sexo feminino e que atenderam aos critérios de inclusão usados nesta tese. Dos 385.357 doadores incluídos na análise, 21.954 (5,7%) tiveram suas doações adiadas devido a seus baixos níveis de hematócrito, 3.850 (1,5%) eram do sexo masculino e 18.104 (13,6%) do sexo feminino. Os resultados obtidos demonstram que, embora os intervalos de espera entre as doações de sangue sejam grandes entre os doadores do sexo feminino e masculino, as mulheres são recusadas mais cedo, por risco de desenvolver anemia, do que os homens. Aproximadamente 12,84% das mulheres e 1,21% dos homens desenvolveriam hematócrito baixo antes da sétima doação. Os dados sugerem que indivíduos com baixo nível de hematócrito devem esperar mais tempo antes de executarem a próxima doação. Portanto, é importante compreender se existe uma ligação entre a doação de sangue e a diminuição no nível de hematócrito, a fim de evitar resultados indesejáveis para os doadores de sangue. O modelo de proveniência apresentado nesta tese não foi definido de acordo com os modelos de proveniência genéricos já implementados. Esta tese apresenta um modelo de proveniência que foi capaz de acrescentar informações semânticas para adquirir conhecimento de um experimento in silico. Um dos principais objetivos foi desenvolver uma abordagem baseada em declarações, tentando responder a importantes questionamentos biológicos. O modelo descrito combina ricas informações em cada processo usando declarações, e se baseia no conhecimento de especialistas. Esta tese também utilizou estatística descritiva e Análise de Sobrevivência. Finalmente, com a validação do modelo em um domínio conhecido, é pretendido expandir esse método para outros sistemas de informação voltados para hemoterapia. The São Paulo Blood Center is responsible to maintain a database with information on each donation. However, this database does not have the quality required by techniques of analysis. For this reason, it is difficult to use it directly to establish systematic relationships between the variables. The main contribution of this paper is a provenance description of attributes selected using classification criteria defined by specialists. We show that it is possible to make detailed investigations using the data description without the need to change the structure of the database. During 1996 2006, 1,469,505 donors were responsible for more than 2.8 million of donation. After the provenance description, we obtained 252,301 male and 133,056 female that met our inclusion criteria. Of the 385,357 donors included in the analysis, 21,954(5.7%) were deferred due to low hematocrit, 3,850(1.5%) were males and 18,104(13.6%) were females. Our results show that, although the intervals between donations for female and male donors are wider, women presented anemia earlier than men. Approximately 12,84% of the females and 1,21% of the males would develop low hematocrit before the 7th donation. Our data suggest that individuals with low hematocrit level should wait longer before the next donation. Therefore, it is important to understand if there is a connection between blood donation and decrease in hematocrit level in order to prevent undesirable outcomes to blood donors. The provenance model presented here was not defined according to the generic provenance models already implemented. This thesis presents a provenance model that is able to add semantic information to acquire knowledge of an in silico experiment. One of the main purposes is to develop an approach based on declarations in order to answer biological questions. The provenance model described in this paper combines rich information for each process using the declarations, each having expert knowledge as a basis. To evaluate this provenance model we use descriptive statistics and Survival Analysis. Finally, with the validation of the model in a known domain, we intent to apply and validate this provenance model to other hemotherapy information systems. Biblioteca Digitais de Teses e Dissertações da USP Ferreira, João Eduardo Sabino, Ester Cerdeira 2012-05-23 Tese de Doutorado application/pdf http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04092012-134137/ pt Liberar o conteúdo para acesso público.