Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade

Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, Programa de Pós-graduação em Engenharia Elétrica, 2012. === Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2012-09-27T15:12:55Z No. of bitstreams: 1 2012_LuizGustavoFlorencio...

Full description

Bibliographic Details
Main Author: Almeida, Wesley Gongora de
Other Authors: Sousa Júnior, Rafael Timóteo de
Language:Portuguese
Published: 2012
Subjects:
Online Access:http://repositorio.unb.br/handle/10482/11378
id ndltd-IBICT-oai-repositorio.unb.br-10482-11378
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Confiabilidade (Engenharia)
Armazenamento de dados
Inteligência competitiva (Administração)
Lógica difusa
spellingShingle Confiabilidade (Engenharia)
Armazenamento de dados
Inteligência competitiva (Administração)
Lógica difusa
Almeida, Wesley Gongora de
Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
description Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, Programa de Pós-graduação em Engenharia Elétrica, 2012. === Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2012-09-27T15:12:55Z No. of bitstreams: 1 2012_LuizGustavoFlorencio.pdf: 1554783 bytes, checksum: bf39a5fc7d6b25cbdf7268d765b0665d (MD5) === Rejected by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br), reason: Alaíde, O arquivo carregado é de outro trabalho. Por favor, verifique. Obrigada! Jacqueline on 2012-10-04T13:30:48Z (GMT) === Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2012-10-04T15:00:53Z No. of bitstreams: 1 2012_WesleyGongoradeAlmeida.pdf: 2251518 bytes, checksum: 14fca6cffeac84fa4f60de38f24f756e (MD5) === Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2012-10-05T10:34:44Z (GMT) No. of bitstreams: 1 2012_WesleyGongoradeAlmeida.pdf: 2251518 bytes, checksum: 14fca6cffeac84fa4f60de38f24f756e (MD5) === Made available in DSpace on 2012-10-05T10:34:44Z (GMT). No. of bitstreams: 1 2012_WesleyGongoradeAlmeida.pdf: 2251518 bytes, checksum: 14fca6cffeac84fa4f60de38f24f756e (MD5) === O impacto da má qualidade dos dados sobre a tomada de decisão, a confiança organizacional e a satisfação do cliente é bem conhecida. Ademais, fatores emergentes, tais como o aumento no volume dos dados, têm agravado o problema. Nas organizações atuais, sistemas de Business Intelligence (BI) têm oferecido suporte à gestão de negócios e se constituindo uma evolução natural e lógica dos Sistemas de Apoio a Decisão. Neste novo cenário, implementações de soluções de BI tem falhado devido a má qualidade dos dados. Supondo que é possível avaliar a qualidade dos dados com base em metadados, a questão principal, então, é: Como fornecer ao usuário informações relativas à qualidade dos dados? Atrelado a esta questão, encontra-se um segundo fator relevante: Durante muito tempo, preocupou-se com a qualidade dos dados sem levar em consideração a questão da confiança. Esta dissertação apresenta uma nova visão a respeito da qualidade e da confiança dos dados, porque, ao contrário do senso comum, a qualidade dos dados não é o único fator influenciando a confiabilidade dos dados e estes dois conceitos não são necessariamente correlacionados. Baixa qualidade pode ser confiável em algumas situações e dados de alta qualidade podem ter baixa confiança em outro contexto. Em nosso trabalho, a avaliação da confiabilidade dos dados em ambientes de BI é baseada em um conjunto de métricas, obtidas a partir de uma taxonomia dos problemas de qualidade. Para representar a incerteza da avaliação, lógica fuzzy é empregada como método de obtenção de uma pontuação global de confiabilidade. Por fim, a proposta desenvolvida é avaliada através de simulações, de forma a ilustrar sua eficácia e demonstrar um avanço em relação aos métodos estado-da-arte conhecidos da literatura. _______________________________________________________________________________________ ABSTRACT === The impact of poor data quality on decision making, organizational trust and customer satisfaction is well known. Furthermore, emerging factors, such as increasing the volume of data, have aggravated the problem. In today's organizations, Business Intelligence (BI) systems have offered support to business management and providing a natural and logical evolution of Decision Support Systems. In this new scenario, implementations of BI solutions have failed due to poor data quality. Assuming it is possible to assess the quality of data based on metadata, the main question then is: How to provide the user with information relating to data quality? Tied to this question lies a second relevant factor: For a long time, worried about the quality of data without taking into account the question of trust. This dissertation presents a new vision about the quality and trustworthiness of the data, because, contrary to common sense, data quality is not the only factor influencing the trustworthiness of data and these two concepts are not necessarily correlated. Low quality can be unreliable in some situations and high-quality data can have little confidence in another context. In our study, evaluating the trustworthiness of data in BI environments is based on a set of metrics, obtained from taxonomy of quality problems. To represent the uncertainty of the evaluation, fuzzy logic is employed as a method of obtaining an overall score of trustworthiness. Finally, the proposal developed is evaluated through simulations, in order to illustrate its effectiveness and demonstrate an improvement over methods state-of-the-art known from the literature.
author2 Sousa Júnior, Rafael Timóteo de
author_facet Sousa Júnior, Rafael Timóteo de
Almeida, Wesley Gongora de
author Almeida, Wesley Gongora de
author_sort Almeida, Wesley Gongora de
title Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
title_short Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
title_full Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
title_fullStr Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
title_full_unstemmed Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
title_sort confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade
publishDate 2012
url http://repositorio.unb.br/handle/10482/11378
work_keys_str_mv AT almeidawesleygongorade confiabilidadededadosemambientesdebusinessintelligenceumaabordagemfuzzybaseadaemtaxonomiasdeproblemasdequalidade
AT almeidawesleygongorade trustworthinessofdatainbusinessintelligenceenvironmentsafuzzyapproachbasedontaxonomyofqualityproblems
_version_ 1718737802521214976
spelling ndltd-IBICT-oai-repositorio.unb.br-10482-113782018-09-23T06:06:52Z Confiabilidade de dados em ambientes de business intelligence : uma abordagem fuzzy baseada em taxonomias de problemas de qualidade Trustworthiness of data in business intelligence environments : a fuzzy approach based on taxonomy of quality problems Almeida, Wesley Gongora de Sousa Júnior, Rafael Timóteo de Confiabilidade (Engenharia) Armazenamento de dados Inteligência competitiva (Administração) Lógica difusa Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, Programa de Pós-graduação em Engenharia Elétrica, 2012. Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2012-09-27T15:12:55Z No. of bitstreams: 1 2012_LuizGustavoFlorencio.pdf: 1554783 bytes, checksum: bf39a5fc7d6b25cbdf7268d765b0665d (MD5) Rejected by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br), reason: Alaíde, O arquivo carregado é de outro trabalho. Por favor, verifique. Obrigada! Jacqueline on 2012-10-04T13:30:48Z (GMT) Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2012-10-04T15:00:53Z No. of bitstreams: 1 2012_WesleyGongoradeAlmeida.pdf: 2251518 bytes, checksum: 14fca6cffeac84fa4f60de38f24f756e (MD5) Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2012-10-05T10:34:44Z (GMT) No. of bitstreams: 1 2012_WesleyGongoradeAlmeida.pdf: 2251518 bytes, checksum: 14fca6cffeac84fa4f60de38f24f756e (MD5) Made available in DSpace on 2012-10-05T10:34:44Z (GMT). No. of bitstreams: 1 2012_WesleyGongoradeAlmeida.pdf: 2251518 bytes, checksum: 14fca6cffeac84fa4f60de38f24f756e (MD5) O impacto da má qualidade dos dados sobre a tomada de decisão, a confiança organizacional e a satisfação do cliente é bem conhecida. Ademais, fatores emergentes, tais como o aumento no volume dos dados, têm agravado o problema. Nas organizações atuais, sistemas de Business Intelligence (BI) têm oferecido suporte à gestão de negócios e se constituindo uma evolução natural e lógica dos Sistemas de Apoio a Decisão. Neste novo cenário, implementações de soluções de BI tem falhado devido a má qualidade dos dados. Supondo que é possível avaliar a qualidade dos dados com base em metadados, a questão principal, então, é: Como fornecer ao usuário informações relativas à qualidade dos dados? Atrelado a esta questão, encontra-se um segundo fator relevante: Durante muito tempo, preocupou-se com a qualidade dos dados sem levar em consideração a questão da confiança. Esta dissertação apresenta uma nova visão a respeito da qualidade e da confiança dos dados, porque, ao contrário do senso comum, a qualidade dos dados não é o único fator influenciando a confiabilidade dos dados e estes dois conceitos não são necessariamente correlacionados. Baixa qualidade pode ser confiável em algumas situações e dados de alta qualidade podem ter baixa confiança em outro contexto. Em nosso trabalho, a avaliação da confiabilidade dos dados em ambientes de BI é baseada em um conjunto de métricas, obtidas a partir de uma taxonomia dos problemas de qualidade. Para representar a incerteza da avaliação, lógica fuzzy é empregada como método de obtenção de uma pontuação global de confiabilidade. Por fim, a proposta desenvolvida é avaliada através de simulações, de forma a ilustrar sua eficácia e demonstrar um avanço em relação aos métodos estado-da-arte conhecidos da literatura. _______________________________________________________________________________________ ABSTRACT The impact of poor data quality on decision making, organizational trust and customer satisfaction is well known. Furthermore, emerging factors, such as increasing the volume of data, have aggravated the problem. In today's organizations, Business Intelligence (BI) systems have offered support to business management and providing a natural and logical evolution of Decision Support Systems. In this new scenario, implementations of BI solutions have failed due to poor data quality. Assuming it is possible to assess the quality of data based on metadata, the main question then is: How to provide the user with information relating to data quality? Tied to this question lies a second relevant factor: For a long time, worried about the quality of data without taking into account the question of trust. This dissertation presents a new vision about the quality and trustworthiness of the data, because, contrary to common sense, data quality is not the only factor influencing the trustworthiness of data and these two concepts are not necessarily correlated. Low quality can be unreliable in some situations and high-quality data can have little confidence in another context. In our study, evaluating the trustworthiness of data in BI environments is based on a set of metrics, obtained from taxonomy of quality problems. To represent the uncertainty of the evaluation, fuzzy logic is employed as a method of obtaining an overall score of trustworthiness. Finally, the proposal developed is evaluated through simulations, in order to illustrate its effectiveness and demonstrate an improvement over methods state-of-the-art known from the literature. 2012-10-05T10:34:44Z 2012-10-05T10:34:44Z 2012-10-05T10:34:44Z 2012-03-16 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis ALMEIDA, Wesley Gongora de. Confiabilidade de dados em ambientes de business intelligence: uma abordagem fuzzy baseada em taxonomias de problemas de qualidade. 2012. xii, 90 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2012. http://repositorio.unb.br/handle/10482/11378 por info:eu-repo/semantics/openAccess reponame:Repositório Institucional da UnB instname:Universidade de Brasília instacron:UNB