Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social

No âmbito da Assistência Social, existe a necessidade de se identificar as famílias em situação de vulnerabilidade e risco social, processo esse chamado de “Busca Ativa”, para que as famílias nesta situação possam ser assistidas adequadamente. O Ministério do Desenvolvimento Social e Combate à Fome...

Full description

Bibliographic Details
Main Author: Terrin, Marcos Alexandre Pastori
Other Authors: Silla Junior, Carlos Nascimento
Language:Portuguese
Published: Universidade Tecnológica Federal do Paraná 2018
Subjects:
Online Access:http://repositorio.utfpr.edu.br/jspui/handle/1/2930
id ndltd-IBICT-oai-repositorio.utfpr.edu.br-1-2930
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic CNPQ::CIENCIAS EXATAS E DA TERRA
Serviço social com a família
Mineração de dados (Computação)
Teoria bayesiana de decisão estatística
Family social work
Data mining
Bayesian statistical decision theory
Ciência da Computação
spellingShingle CNPQ::CIENCIAS EXATAS E DA TERRA
Serviço social com a família
Mineração de dados (Computação)
Teoria bayesiana de decisão estatística
Family social work
Data mining
Bayesian statistical decision theory
Ciência da Computação
Terrin, Marcos Alexandre Pastori
Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
description No âmbito da Assistência Social, existe a necessidade de se identificar as famílias em situação de vulnerabilidade e risco social, processo esse chamado de “Busca Ativa”, para que as famílias nesta situação possam ser assistidas adequadamente. O Ministério do Desenvolvimento Social e Combate à Fome do Brasil orienta que seja realizado o cruzamento de bases de dados como forma de realizar a Busca Ativa, mas não disponibiliza nenhuma ferramenta para realização desse processo. Este trabalho busca identificar e aplicar técnicas de mineração de dados para apoiar a identificação das famílias em situação de vulnerabilidade e risco social. Os resultados obtidos em experimentos preliminares demonstraram que na maioria dos casos os modelos gerados preveem sempre a classe majoritária. Após realizar um balanceamento manual das classes removendo algumas amostras os experimentos foram repetidos e indicaram que os resultados estavam sendo diretamente afetados devido ao desbalanceamento das classes. Por esse motivo foram utilizados diversos métodos específicos para realizar o balanceamento das amostras a fim de que todas as classes possuíssem a mesma quantidade de amostras. Após realizar o balanceamento das amostras novos experimentos foram realizados. Durante a análise dos resultados foi observado que com as medidas padrões de avaliação de aprendizado de máquina não estava sendo possível identificar qual método havia obtido o melhor resultado. Em função disso um método de qualidade de ranking foi utilizado juntamente com a medida Recall para avaliar os resultados. === In the current Brazilian Government there is a Social Assistance policy that is highly concerned about helping families who might be at social risk and vulnerability. The process of identification of these families is known as “active search”. The task of active search is defined in a document by the Brazilian Ministry of Social Development and Fight Against Hunger. This document provides the main guidelines about how to perform the active search. However, despite the task’s importance, there are still no tool to help the social assistants with this task. This work aim to investigate the use of data mining techniques to identify the families in vulnerability and social risk situations. The results obtained in preliminary experiments showed that the classification models created always predict the majority class. After balancing manually the datasets by removing some examples the experiments were repeated and showed that the results were being directly influenced by the imbalanced data. Because of it was used a bunch of sampling methods to produce the same amount of examples in each class. After proceed with the sampling of the examples new experiments were proceeded. During the result’s evaluation it was realized that the standard metrics used in machine learn were not being able to identify wich method obtained the best result. Due to this situation a ranking quality method was used combined with the Recall metric to evaluate the results.
author2 Silla Junior, Carlos Nascimento
author_facet Silla Junior, Carlos Nascimento
Terrin, Marcos Alexandre Pastori
author Terrin, Marcos Alexandre Pastori
author_sort Terrin, Marcos Alexandre Pastori
title Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
title_short Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
title_full Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
title_fullStr Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
title_full_unstemmed Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
title_sort utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social
publisher Universidade Tecnológica Federal do Paraná
publishDate 2018
url http://repositorio.utfpr.edu.br/jspui/handle/1/2930
work_keys_str_mv AT terrinmarcosalexandrepastori utilizandotecnicasdemineracaodedadosparaapoiarabuscaativadefamiliasemsituacaodevulnerabilidadeeriscosocial
AT terrinmarcosalexandrepastori usingdataminingtechniquestosupportactivesearchforfamiliesinsituationsofsocialriskandvulnerability
_version_ 1718680920029921280
spelling ndltd-IBICT-oai-repositorio.utfpr.edu.br-1-29302018-05-28T04:40:26Z Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social Using data mining techniques to support active search for families in situations of social risk and vulnerability Terrin, Marcos Alexandre Pastori Silla Junior, Carlos Nascimento Bugatti, Pedro Henrique Silla Junior, Carlos Nascimento Bugatti, Pedro Henrique Bressan, Glaucia Maria Cavalin, Paulo Rodrigo CNPQ::CIENCIAS EXATAS E DA TERRA Serviço social com a família Mineração de dados (Computação) Teoria bayesiana de decisão estatística Family social work Data mining Bayesian statistical decision theory Ciência da Computação No âmbito da Assistência Social, existe a necessidade de se identificar as famílias em situação de vulnerabilidade e risco social, processo esse chamado de “Busca Ativa”, para que as famílias nesta situação possam ser assistidas adequadamente. O Ministério do Desenvolvimento Social e Combate à Fome do Brasil orienta que seja realizado o cruzamento de bases de dados como forma de realizar a Busca Ativa, mas não disponibiliza nenhuma ferramenta para realização desse processo. Este trabalho busca identificar e aplicar técnicas de mineração de dados para apoiar a identificação das famílias em situação de vulnerabilidade e risco social. Os resultados obtidos em experimentos preliminares demonstraram que na maioria dos casos os modelos gerados preveem sempre a classe majoritária. Após realizar um balanceamento manual das classes removendo algumas amostras os experimentos foram repetidos e indicaram que os resultados estavam sendo diretamente afetados devido ao desbalanceamento das classes. Por esse motivo foram utilizados diversos métodos específicos para realizar o balanceamento das amostras a fim de que todas as classes possuíssem a mesma quantidade de amostras. Após realizar o balanceamento das amostras novos experimentos foram realizados. Durante a análise dos resultados foi observado que com as medidas padrões de avaliação de aprendizado de máquina não estava sendo possível identificar qual método havia obtido o melhor resultado. Em função disso um método de qualidade de ranking foi utilizado juntamente com a medida Recall para avaliar os resultados. In the current Brazilian Government there is a Social Assistance policy that is highly concerned about helping families who might be at social risk and vulnerability. The process of identification of these families is known as “active search”. The task of active search is defined in a document by the Brazilian Ministry of Social Development and Fight Against Hunger. This document provides the main guidelines about how to perform the active search. However, despite the task’s importance, there are still no tool to help the social assistants with this task. This work aim to investigate the use of data mining techniques to identify the families in vulnerability and social risk situations. The results obtained in preliminary experiments showed that the classification models created always predict the majority class. After balancing manually the datasets by removing some examples the experiments were repeated and showed that the results were being directly influenced by the imbalanced data. Because of it was used a bunch of sampling methods to produce the same amount of examples in each class. After proceed with the sampling of the examples new experiments were proceeded. During the result’s evaluation it was realized that the standard metrics used in machine learn were not being able to identify wich method obtained the best result. Due to this situation a ranking quality method was used combined with the Recall metric to evaluate the results. 2018-02-20T19:48:54Z 2018-02-20T19:48:54Z 2015-08-18 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis TERRIN, Marcos Alexandre Pastori. Utilizando técnicas de mineração de dados para apoiar a busca ativa de famílias em situação de vulnerabilidade e risco social. 2015. 133 f. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2015. http://repositorio.utfpr.edu.br/jspui/handle/1/2930 por info:eu-repo/semantics/openAccess Universidade Tecnológica Federal do Paraná Cornelio Procopio Programa de Pós-Graduação em Informática UTFPR Brasil reponame:Repositório Institucional da UTFPR instname:Universidade Tecnológica Federal do Paraná instacron:UTFPR