Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais

A mineração de dados educacionais é uma área recente de pesquisa que está ganhando popularidade por causa de seus potenciais para as instituições de ensino. Um dos desafios dessas instituições é a redução da evasão escolar. A evasão no ensino superior é um fenômeno em crescimento e tornou-se foco de...

Full description

Bibliographic Details
Main Author: Oliveira Júnior, José Gonçalves de
Other Authors: Kaestner, Celso Antônio Alves
Language:Portuguese
Published: Universidade Tecnológica Federal do Paraná 2017
Subjects:
Online Access:http://repositorio.utfpr.edu.br/jspui/handle/1/1995
id ndltd-IBICT-urn-repox.ist.utl.pt-RI_UTFPR-oai-repositorio.utfpr.edu.br-1-1995
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Universidade Tecnológica Federal do Paraná
Mineração de dados (Computação)
Evasão escolar
Computação
Data mining
Dropouts
Computer science
spellingShingle CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Universidade Tecnológica Federal do Paraná
Mineração de dados (Computação)
Evasão escolar
Computação
Data mining
Dropouts
Computer science
Oliveira Júnior, José Gonçalves de
Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
description A mineração de dados educacionais é uma área recente de pesquisa que está ganhando popularidade por causa de seus potenciais para as instituições de ensino. Um dos desafios dessas instituições é a redução da evasão escolar. A evasão no ensino superior é um fenômeno em crescimento e tornou-se foco de preocupação para pesquisadores de diferentes áreas. Entretanto, as características da evasão ainda são pouco estudadas e há carência de informações e modelos de identificação dos seus motivos. Esta pesquisa propõe uma abordagem computacional para a identificação de padrões a serem utilizados na análise da evasão de estudantes em cursos presenciais de graduação, a fim de auxiliar os tomadores de decisão das instituições de ensino. Propõe-se um método para seleção dos melhores atributos para tarefa de classificação, que considera as classes “haverá evasão” e “não haverá evasão”, baseado na seleção e criação de atributos. Os experimentos foram realizados com dados de alunos da Universidade Tecnológica Federal do Paraná, consolidados em um Data Warehouse, que permitiu investigar a evasão entre os anos de 1980 e 2014. Nesta pesquisa são abordados os problemas mais comuns que ocorrem na mineração de dados educacionais, como a seleção do subconjunto de atributos, dados desbalanceados, valores discrepantes e sobreajuste. Os resultados experimentais apresentam os atributos mais relevantes a previsão da evasão, indicando a contribuição da criação de atributos na tarefa de mineração de dados, permitindo com estas inferências apoiar a tomada de decisão pelos gestores educacionais situados nos níveis estratégico, tático e operacional. === Educational data mining is a recent research area that is gaining popularity because of their potential for educational institutions. One of the challenges of these institutions is to reduce the course dropout. The dropout in higher education is a phenomenon in growth and has become the focus of concern for researchers from different areas. However, the avoidance features are poorly studied and there is a lack of information and identification of models of their motives. This research proposes a computational approach for identifying patterns to be used in the analysis of dropout students in undergraduate classroom courses, in order to assist decision-makers in educational institutions. The proposed method selects the best attributes for classification task, in which the classes “dropout” and “non-dropout” are considered, based on the feature subset selection and feature creation. The experiments were conducted with the undergraduate students’ data at the Federal University of Technology - Paraná, consolidated in a Data Warehouse, that allowed the dropout investigation between the years 1980 and 2014. In this research are discussed the most common problems that occur in educational data mining, such as feature subset selection, unbalanced data, outliers and overfitting. The experimental results show the most relevant attributes to dropout prediction, indicating the contribution of the feature creation in the data mining task, allowing with these inferences to support the decision-making by educational managers located in strategic, tactical and operational levels.
author2 Kaestner, Celso Antônio Alves
author_facet Kaestner, Celso Antônio Alves
Oliveira Júnior, José Gonçalves de
author Oliveira Júnior, José Gonçalves de
author_sort Oliveira Júnior, José Gonçalves de
title Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
title_short Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
title_full Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
title_fullStr Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
title_full_unstemmed Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
title_sort identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais
publisher Universidade Tecnológica Federal do Paraná
publishDate 2017
url http://repositorio.utfpr.edu.br/jspui/handle/1/1995
work_keys_str_mv AT oliveirajuniorjosegoncalvesde identificacaodepadroesparaaanalisedaevasaoemcursosdegraduacaousandomineracaodedadoseducacionais
AT oliveirajuniorjosegoncalvesde patternidentificationfordropoutanalysisinundergraduatecoursesusingeeducationaldatamining
_version_ 1718675872086491136
spelling ndltd-IBICT-urn-repox.ist.utl.pt-RI_UTFPR-oai-repositorio.utfpr.edu.br-1-19952018-05-23T23:40:56Z Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais Pattern identification for dropout analysis in undergraduate courses usinge educational data mining Oliveira Júnior, José Gonçalves de Kaestner, Celso Antônio Alves Noronha, Robinson Vida Kaestner, Celso Antônio Alves Noronha, Robinson Vida Silva, Leandro Augusto da Bastos, Laudelino Cordeiro CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Universidade Tecnológica Federal do Paraná Mineração de dados (Computação) Evasão escolar Computação Data mining Dropouts Computer science A mineração de dados educacionais é uma área recente de pesquisa que está ganhando popularidade por causa de seus potenciais para as instituições de ensino. Um dos desafios dessas instituições é a redução da evasão escolar. A evasão no ensino superior é um fenômeno em crescimento e tornou-se foco de preocupação para pesquisadores de diferentes áreas. Entretanto, as características da evasão ainda são pouco estudadas e há carência de informações e modelos de identificação dos seus motivos. Esta pesquisa propõe uma abordagem computacional para a identificação de padrões a serem utilizados na análise da evasão de estudantes em cursos presenciais de graduação, a fim de auxiliar os tomadores de decisão das instituições de ensino. Propõe-se um método para seleção dos melhores atributos para tarefa de classificação, que considera as classes “haverá evasão” e “não haverá evasão”, baseado na seleção e criação de atributos. Os experimentos foram realizados com dados de alunos da Universidade Tecnológica Federal do Paraná, consolidados em um Data Warehouse, que permitiu investigar a evasão entre os anos de 1980 e 2014. Nesta pesquisa são abordados os problemas mais comuns que ocorrem na mineração de dados educacionais, como a seleção do subconjunto de atributos, dados desbalanceados, valores discrepantes e sobreajuste. Os resultados experimentais apresentam os atributos mais relevantes a previsão da evasão, indicando a contribuição da criação de atributos na tarefa de mineração de dados, permitindo com estas inferências apoiar a tomada de decisão pelos gestores educacionais situados nos níveis estratégico, tático e operacional. Educational data mining is a recent research area that is gaining popularity because of their potential for educational institutions. One of the challenges of these institutions is to reduce the course dropout. The dropout in higher education is a phenomenon in growth and has become the focus of concern for researchers from different areas. However, the avoidance features are poorly studied and there is a lack of information and identification of models of their motives. This research proposes a computational approach for identifying patterns to be used in the analysis of dropout students in undergraduate classroom courses, in order to assist decision-makers in educational institutions. The proposed method selects the best attributes for classification task, in which the classes “dropout” and “non-dropout” are considered, based on the feature subset selection and feature creation. The experiments were conducted with the undergraduate students’ data at the Federal University of Technology - Paraná, consolidated in a Data Warehouse, that allowed the dropout investigation between the years 1980 and 2014. In this research are discussed the most common problems that occur in educational data mining, such as feature subset selection, unbalanced data, outliers and overfitting. The experimental results show the most relevant attributes to dropout prediction, indicating the contribution of the feature creation in the data mining task, allowing with these inferences to support the decision-making by educational managers located in strategic, tactical and operational levels. 2017-02-23T18:05:17Z 2017-02-23T18:05:17Z 2015-12-08 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis OLIVEIRA JÚNIOR, José Gonçalves de. Identificação de padrões para a análise da evasão em cursos de graduação usando mineração de dados educacionais. 2015. 86 f. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2015. http://repositorio.utfpr.edu.br/jspui/handle/1/1995 por info:eu-repo/semantics/openAccess Universidade Tecnológica Federal do Paraná Curitiba Programa de Pós-Graduação em Computação Aplicada UTFPR Brasil reponame:Repositório Institucional da UTFPR instname:Universidade Tecnológica Federal do Paraná instacron:UTFPR