Tratamento temporal em mineração de dados educacionais para fidelização de estudantes

O tratamento temporal tem se revelado importante em muitos problemas de mineração de dados em que a base de dados é formada por dados coletados historicamente [Romero e Ventura 2007]. Um exemplo desta situação ocorre em instituições de ensino, onde os dados históricos dos alunos - tais como o desemp...

Full description

Bibliographic Details
Main Author: Fazolin, Kleyton
Other Authors: Kaestner, Celso Antônio Alves
Language:Portuguese
Published: Universidade Tecnológica Federal do Paraná 2017
Subjects:
Online Access:http://repositorio.utfpr.edu.br/jspui/handle/1/2883
id ndltd-IBICT-oai-repositorio.utfpr.edu.br-1-2883
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Mineração de dados (Computação)
Estudantes do ensino fundamental
Evasão escolar
Lealdade
Armazenamento de dados
Banco de dados
Engenharia de sistemas
Computação
Data mining
School children
Dropouts
Loyalty
Data Warehousing
Data bases
Systems engineering
Computer science
Ciência da Computação
spellingShingle CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Mineração de dados (Computação)
Estudantes do ensino fundamental
Evasão escolar
Lealdade
Armazenamento de dados
Banco de dados
Engenharia de sistemas
Computação
Data mining
School children
Dropouts
Loyalty
Data Warehousing
Data bases
Systems engineering
Computer science
Ciência da Computação
Fazolin, Kleyton
Tratamento temporal em mineração de dados educacionais para fidelização de estudantes
description O tratamento temporal tem se revelado importante em muitos problemas de mineração de dados em que a base de dados é formada por dados coletados historicamente [Romero e Ventura 2007]. Um exemplo desta situação ocorre em instituições de ensino, onde os dados históricos dos alunos - tais como o desempenho escolar e a situação financeira - vem sendo adquiridos paulatinamente ao longo do tempo [Romero e Ventura 2007]. Este trabalho apresenta uma proposta de criação de atributos temporais com o objetivo de auxiliar a previsão da evasão de alunos de Ensino Fundamental em escolas particulares, tratada como um problema de classificação. A fidelização e retenção de alunos em instituições de ensino se tornou um dos maiores desafios para a área de gestão destas instituições [Lin 2012]. Uma solução promissora para alcançar esse objetivo é o uso da mineração de dados educacionais, para a identificação de padrões que auxiliem nas tomadas de decisões. Para a realização dos experimentos, os dados de 15.753 alunos da Rede Educacional Adventista – uma das maiores redes educacionais do mundo [“Educação Adventista” 2016] – foram extraídos e utilizados. Após a aplicação dos algoritmos de classificação, verificou-se que o classificador baseado em instâncias KNN conseguiu a melhor acurácia antes do uso dos novos atributos temporais criados, porém o melhor algoritmo para efetuar previsão da evasão no contexto desta pesquisa foi a Árvore de Decisão J4.8, pois permite a interpretação dos fatores que levaram ao resultado final. Os resultados mostram que a abordagem é viável, tendo-se obtido uma acurácia de até 96,57% utilizando o algoritmo J48 e um aumento de 14,39% na acurácia do classificador KNN com o uso dos atributos temporais. === The creation of temporal attributes has proved important in many data mining problems in that the database is formed by data collected historically [Romero e Ventura 2007]. An example of this situation occurs in educational institutions, where the historical data of students – such as school performance and financial situation – has been gradually acquired over time [Romero e Ventura 2007]. This paper presents a proposal for the creation of temporal attributes with the purpose of helping to predict the avoidance of elementary school students in private schools, treated as a classification problem. The loyalty and retention of students in educational institutions has become one of the greatest challenges for the management area of these institutions [Lin 2012]. A promising solution to achieve this goal is the use of educational data mining to identify patterns that aid in decision making. For the experiments, the data of 15,753 students of the Adventist Educational Network – one of the largest educational networks in the world [“Educação Adventista” 2016]– were employed. After the application of the classification algorithms, it was verified that the instance-based KNN classifier obtained the best accuracy before the use of the time attributes created, but the best algorithm to predict the avoidance in the context of this research was the Decision Tree J4.8 algorithm, because it allows the interpretation of the factors that led to the final result. The results show that the approach is feasible, obtaining an accuracy of up to 97.87% in the experiments performed and a gain of up to 14.39% in the accuracy when using the KNN with temporal attributes.
author2 Kaestner, Celso Antônio Alves
author_facet Kaestner, Celso Antônio Alves
Fazolin, Kleyton
author Fazolin, Kleyton
author_sort Fazolin, Kleyton
title Tratamento temporal em mineração de dados educacionais para fidelização de estudantes
title_short Tratamento temporal em mineração de dados educacionais para fidelização de estudantes
title_full Tratamento temporal em mineração de dados educacionais para fidelização de estudantes
title_fullStr Tratamento temporal em mineração de dados educacionais para fidelização de estudantes
title_full_unstemmed Tratamento temporal em mineração de dados educacionais para fidelização de estudantes
title_sort tratamento temporal em mineração de dados educacionais para fidelização de estudantes
publisher Universidade Tecnológica Federal do Paraná
publishDate 2017
url http://repositorio.utfpr.edu.br/jspui/handle/1/2883
work_keys_str_mv AT fazolinkleyton tratamentotemporalemmineracaodedadoseducacionaisparafidelizacaodeestudantes
AT fazolinkleyton temporytreatmentindataminingeducationalforfidelizationofstudents
_version_ 1718681151195840512
spelling ndltd-IBICT-oai-repositorio.utfpr.edu.br-1-28832018-05-28T04:41:21Z Tratamento temporal em mineração de dados educacionais para fidelização de estudantes Tempory treatment in data mining educational for fidelization of students Fazolin, Kleyton Kaestner, Celso Antônio Alves Noronha, Robinson Vida Kaestner, Celso Antônio Alves Nievola, Julio Cesar Bastos, Laudelino Cordeiro Noronha, Robinson Vida CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Mineração de dados (Computação) Estudantes do ensino fundamental Evasão escolar Lealdade Armazenamento de dados Banco de dados Engenharia de sistemas Computação Data mining School children Dropouts Loyalty Data Warehousing Data bases Systems engineering Computer science Ciência da Computação O tratamento temporal tem se revelado importante em muitos problemas de mineração de dados em que a base de dados é formada por dados coletados historicamente [Romero e Ventura 2007]. Um exemplo desta situação ocorre em instituições de ensino, onde os dados históricos dos alunos - tais como o desempenho escolar e a situação financeira - vem sendo adquiridos paulatinamente ao longo do tempo [Romero e Ventura 2007]. Este trabalho apresenta uma proposta de criação de atributos temporais com o objetivo de auxiliar a previsão da evasão de alunos de Ensino Fundamental em escolas particulares, tratada como um problema de classificação. A fidelização e retenção de alunos em instituições de ensino se tornou um dos maiores desafios para a área de gestão destas instituições [Lin 2012]. Uma solução promissora para alcançar esse objetivo é o uso da mineração de dados educacionais, para a identificação de padrões que auxiliem nas tomadas de decisões. Para a realização dos experimentos, os dados de 15.753 alunos da Rede Educacional Adventista – uma das maiores redes educacionais do mundo [“Educação Adventista” 2016] – foram extraídos e utilizados. Após a aplicação dos algoritmos de classificação, verificou-se que o classificador baseado em instâncias KNN conseguiu a melhor acurácia antes do uso dos novos atributos temporais criados, porém o melhor algoritmo para efetuar previsão da evasão no contexto desta pesquisa foi a Árvore de Decisão J4.8, pois permite a interpretação dos fatores que levaram ao resultado final. Os resultados mostram que a abordagem é viável, tendo-se obtido uma acurácia de até 96,57% utilizando o algoritmo J48 e um aumento de 14,39% na acurácia do classificador KNN com o uso dos atributos temporais. The creation of temporal attributes has proved important in many data mining problems in that the database is formed by data collected historically [Romero e Ventura 2007]. An example of this situation occurs in educational institutions, where the historical data of students – such as school performance and financial situation – has been gradually acquired over time [Romero e Ventura 2007]. This paper presents a proposal for the creation of temporal attributes with the purpose of helping to predict the avoidance of elementary school students in private schools, treated as a classification problem. The loyalty and retention of students in educational institutions has become one of the greatest challenges for the management area of these institutions [Lin 2012]. A promising solution to achieve this goal is the use of educational data mining to identify patterns that aid in decision making. For the experiments, the data of 15,753 students of the Adventist Educational Network – one of the largest educational networks in the world [“Educação Adventista” 2016]– were employed. After the application of the classification algorithms, it was verified that the instance-based KNN classifier obtained the best accuracy before the use of the time attributes created, but the best algorithm to predict the avoidance in the context of this research was the Decision Tree J4.8 algorithm, because it allows the interpretation of the factors that led to the final result. The results show that the approach is feasible, obtaining an accuracy of up to 97.87% in the experiments performed and a gain of up to 14.39% in the accuracy when using the KNN with temporal attributes. 2017-12-28T17:35:30Z 2017-12-28T17:35:30Z 2017-08-22 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis FAZOLIN, Kleyton. Tratamento temporal em mineração de dados educacionais para fidelização de estudantes. 2017. 114 f. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2017. http://repositorio.utfpr.edu.br/jspui/handle/1/2883 por info:eu-repo/semantics/openAccess Universidade Tecnológica Federal do Paraná Curitiba Programa de Pós-Graduação em Computação Aplicada UTFPR Brasil reponame:Repositório Institucional da UTFPR instname:Universidade Tecnológica Federal do Paraná instacron:UTFPR