Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte

=== This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and...

Full description

Bibliographic Details
Main Author: Eduardo de Mattos Pinto Coelho
Other Authors: Marcello Peixoto Bax
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2012
Online Access:http://hdl.handle.net/1843/ECID-92AP35
id ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-ECID-92AP35
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
description === This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and fuzzy systems, can even help facilitate the success of data mining in the recovery of these large volumes of data. This hypothesis is based on three premises. The first premise is that the solution uses the capture, processing, modeling, representation and formal incorporation of domain knowledge, in particular, constituted by thecollective knowledge of experts. The second premise is that ontologies are perfectlysuited to the task of knowledge incorporation. This adequacy is obtained in view ofthe characteristics of ontologies in explicit, formalize, verify and consolidate the knowledge, making them sharable, reusable and interoperable. In addition, the knowledge represented and incorporated is naturally used for classification, from the inherent inference mechanisms of development tools ontologies, and the mechanisms ofinferences that can be added to them. The third premise is that, considering that the collective knowledge of experts is vague and subjective in nature, methodologies and techniques in the area of fuzzy systems are adequate to capture, treat andmodel this knowledge. Then, we have developed a solution for the pre-and post-processing of data mining, focused on modeling expert knowledge of nature vague and subjective. This vague and subjective knowledge is modeled to attributes with fuzzy systems techniques, guiding the process of data mining, and generating a subjective measure that supports the analysis and interpretation of results that otherwise would be more laborious, difficult or even impossible to be performed. Thus, we present an effective solution for increasing tax revenue through the identification of evidence of fraud and tax evasion on imported services for companies of Belo Horizonte. Based on this approach, tests and simulations conducted, we can reduce the numberof rules of interest generated by data mining by 42%. Comparing the number of records in data mining detected by this approach, with the number of known records involving fraud proven, we obtained an overall success rate of 95.88%. This solution has the potential to be applied in other situations, and in wide areas of application in the public and private sphere. The project explores the convergence of skills developed by three different institutions: the School of Information Science at UFMG, the Department of Computer Science at UFMG and the Finance City Office of BeloHorizonte. === Este projeto de pesquisa tem como objetivo o aprimoramento de tecnologia de suporte à detecção, análise e combate a fraudes fiscais no Imposto Sobre Serviços de Qualquer Natureza ISSQN a partir da recuperação e processamento de grande volume de dados. A hipótese que lançamos é que a associação de metodologias e técnicas de ontologias e sistemas difusos pode auxiliar e mesmo viabilizar o sucesso da mineração de dados na recuperação destes grandes volumes de dados. Esta hipótese fundamenta-se em três premissas. A primeira premissa é que a solução passa pela necessidade da captura, tratamento, modelagem, representação formal e incorporação do conhecimentode domínio, em especial, o constituído pelo conhecimento coletivo de especialistas. A segunda premissa é que ontologias adequam-se perfeitamente à tarefa dessa incorporação de conhecimento. Essa adequação se faz em vista das características das ontologias em explicitar, formalizar, verificar, e consolidar conhecimentos, tornando-os compartilháveis, reutilizáveis e interoperáveis. Além disso, o conhecimento representado e incorporado é naturalmente utilizado para fins de classificação, a partir dos mecanismos de inferências inerentes às ferramentas de desenvolvimento de ontologias, e aos mecanismos de inferências que podem ser agregados a elas. A terceira premissa é que, considerando-se que esse conhecimento coletivo de especialistas é de natureza vaga e subjetiva, as metodologias e técnicas da área de sistemas difusos são adequadas para capturar, tratar e modelar esse conhecimento. Com isto, desenvolvemos uma solução para o pré e pós-processamento de dados na mineração, focada na modelagem de conhecimento especialista de natureza vaga e subjetiva. Este conhecimento vago e subjetivo é modelado em atributos com técnicas de sistemas difusos, guiando o processo demineração de dados, e gerando uma medida subjetiva que suporta a análise e interpretação de resultados, que de outro modo, seria mais laboriosa, difícil oumesmo impossível de ser realizada. Desse modo, apresentamos uma solução efetiva para o aumento da arrecadação tributária, através da identificação deevidências de fraudes e evasão tributária em serviços importados por empresas de Belo Horizonte. Com base nesta abordagem, nos testes e simulações realizados, pudemos reduzir o número de regras de interesse geradas pela mineração de dadosem 42%. Comparando-se o número de registros detectados na mineração de dados por esta abordagem, com o número de registros conhecidos envolvendo fraudes comprovadas, obtivemos uma taxa de sucesso global de 95,88%. Esta solução tem o potencial para ser aplicada em outras situações, e em amplas áreas de aplicaçãona esfera pública e privada. O projeto explora a convergência das habilidades desenvolvidas por três diferentes instituições: a Escola de Ciência da Informação da UFMG, o Departamento de Ciência da Computação da UFMG e a Secretaria Municipal de Finanças da Prefeitura de Belo Horizonte.
author2 Marcello Peixoto Bax
author_facet Marcello Peixoto Bax
Eduardo de Mattos Pinto Coelho
author Eduardo de Mattos Pinto Coelho
spellingShingle Eduardo de Mattos Pinto Coelho
Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
author_sort Eduardo de Mattos Pinto Coelho
title Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_short Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_full Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_fullStr Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_full_unstemmed Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_sort ontologias difusas no suporte à mineração de dados: aplicações na secretaria de finanças da prefeitura municipal de belo horizonte
publisher Universidade Federal de Minas Gerais
publishDate 2012
url http://hdl.handle.net/1843/ECID-92AP35
work_keys_str_mv AT eduardodemattospintocoelho ontologiasdifusasnosuporteamineracaodedadosaplicacoesnasecretariadefinancasdaprefeituramunicipaldebelohorizonte
_version_ 1718845053143613440
spelling ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-ECID-92AP352019-01-21T17:58:42Z Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte Eduardo de Mattos Pinto Coelho Marcello Peixoto Bax Wagner Meira Junior Wagner Meira Junior Alberto Henrique Frade Laender Mauricio Barcellos Almeida Renata Maria Abrantes Baracho Porto Fernando Silva Parreiras Frederico Luiz Gonçalves de Freitas This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and fuzzy systems, can even help facilitate the success of data mining in the recovery of these large volumes of data. This hypothesis is based on three premises. The first premise is that the solution uses the capture, processing, modeling, representation and formal incorporation of domain knowledge, in particular, constituted by thecollective knowledge of experts. The second premise is that ontologies are perfectlysuited to the task of knowledge incorporation. This adequacy is obtained in view ofthe characteristics of ontologies in explicit, formalize, verify and consolidate the knowledge, making them sharable, reusable and interoperable. In addition, the knowledge represented and incorporated is naturally used for classification, from the inherent inference mechanisms of development tools ontologies, and the mechanisms ofinferences that can be added to them. The third premise is that, considering that the collective knowledge of experts is vague and subjective in nature, methodologies and techniques in the area of fuzzy systems are adequate to capture, treat andmodel this knowledge. Then, we have developed a solution for the pre-and post-processing of data mining, focused on modeling expert knowledge of nature vague and subjective. This vague and subjective knowledge is modeled to attributes with fuzzy systems techniques, guiding the process of data mining, and generating a subjective measure that supports the analysis and interpretation of results that otherwise would be more laborious, difficult or even impossible to be performed. Thus, we present an effective solution for increasing tax revenue through the identification of evidence of fraud and tax evasion on imported services for companies of Belo Horizonte. Based on this approach, tests and simulations conducted, we can reduce the numberof rules of interest generated by data mining by 42%. Comparing the number of records in data mining detected by this approach, with the number of known records involving fraud proven, we obtained an overall success rate of 95.88%. This solution has the potential to be applied in other situations, and in wide areas of application in the public and private sphere. The project explores the convergence of skills developed by three different institutions: the School of Information Science at UFMG, the Department of Computer Science at UFMG and the Finance City Office of BeloHorizonte. Este projeto de pesquisa tem como objetivo o aprimoramento de tecnologia de suporte à detecção, análise e combate a fraudes fiscais no Imposto Sobre Serviços de Qualquer Natureza ISSQN a partir da recuperação e processamento de grande volume de dados. A hipótese que lançamos é que a associação de metodologias e técnicas de ontologias e sistemas difusos pode auxiliar e mesmo viabilizar o sucesso da mineração de dados na recuperação destes grandes volumes de dados. Esta hipótese fundamenta-se em três premissas. A primeira premissa é que a solução passa pela necessidade da captura, tratamento, modelagem, representação formal e incorporação do conhecimentode domínio, em especial, o constituído pelo conhecimento coletivo de especialistas. A segunda premissa é que ontologias adequam-se perfeitamente à tarefa dessa incorporação de conhecimento. Essa adequação se faz em vista das características das ontologias em explicitar, formalizar, verificar, e consolidar conhecimentos, tornando-os compartilháveis, reutilizáveis e interoperáveis. Além disso, o conhecimento representado e incorporado é naturalmente utilizado para fins de classificação, a partir dos mecanismos de inferências inerentes às ferramentas de desenvolvimento de ontologias, e aos mecanismos de inferências que podem ser agregados a elas. A terceira premissa é que, considerando-se que esse conhecimento coletivo de especialistas é de natureza vaga e subjetiva, as metodologias e técnicas da área de sistemas difusos são adequadas para capturar, tratar e modelar esse conhecimento. Com isto, desenvolvemos uma solução para o pré e pós-processamento de dados na mineração, focada na modelagem de conhecimento especialista de natureza vaga e subjetiva. Este conhecimento vago e subjetivo é modelado em atributos com técnicas de sistemas difusos, guiando o processo demineração de dados, e gerando uma medida subjetiva que suporta a análise e interpretação de resultados, que de outro modo, seria mais laboriosa, difícil oumesmo impossível de ser realizada. Desse modo, apresentamos uma solução efetiva para o aumento da arrecadação tributária, através da identificação deevidências de fraudes e evasão tributária em serviços importados por empresas de Belo Horizonte. Com base nesta abordagem, nos testes e simulações realizados, pudemos reduzir o número de regras de interesse geradas pela mineração de dadosem 42%. Comparando-se o número de registros detectados na mineração de dados por esta abordagem, com o número de registros conhecidos envolvendo fraudes comprovadas, obtivemos uma taxa de sucesso global de 95,88%. Esta solução tem o potencial para ser aplicada em outras situações, e em amplas áreas de aplicaçãona esfera pública e privada. O projeto explora a convergência das habilidades desenvolvidas por três diferentes instituições: a Escola de Ciência da Informação da UFMG, o Departamento de Ciência da Computação da UFMG e a Secretaria Municipal de Finanças da Prefeitura de Belo Horizonte. 2012-11-05 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/1843/ECID-92AP35 por info:eu-repo/semantics/openAccess text/html Universidade Federal de Minas Gerais 32001010028P2 - CIÊNCIA DA INFORMAÇÃO UFMG BR reponame:Biblioteca Digital de Teses e Dissertações da UFMG instname:Universidade Federal de Minas Gerais instacron:UFMG