Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (...
Main Author: | SILVA FILHO, Rogério Luiz Cardoso |
---|---|
Other Authors: | ADEODATO, Paulo Jorge Leitão |
Format: | doctoralThesis |
Language: | por |
Published: |
Universidade Federal de Pernambuco
2018
|
Subjects: | |
Online Access: |
https://repositorio.ufpe.br/handle/123456789/28008 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
ir-123456789-28008 |
---|---|
recordtype |
dspace |
spelling |
ir-123456789-280082018-12-06T05:06:39Z Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar SILVA FILHO, Rogério Luiz Cardoso ADEODATO, Paulo Jorge Leitão http://lattes.cnpq.br/9212443460705379 http://lattes.cnpq.br/3524590211304012 Mineração de dados Desempenho escolar O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas. Throughout the years, the Brazilian Secondary School has gone through constant debates about its problems of access and permanence, quality of teaching and even of its identity. The growth in the offer of vocational education integrated to secondary schools, starred by the Federal Institutes (IFs), created in 2008, has brought interesting results in view of the large investments of the Federal Government. Thus, new mechanisms that subsidize managers in the decision-making process and in the evaluation of the "supply-quality" binomial of these institutions become increasingly necessary. This dissertation, considering the evaluative role of Secondary School Student Test (ENEM), presents a data mining solution in a Knowledge Discovery in Databases (KDD) process for predicting and estimating the performance of secondary school students of IFs. For the extraction of knowledge, the CRoss-Industry Standard Process for Data Mining (CRISP-DM) method was used associated with the ideas of the Domain-Driven Data Mining (D3M) framework, in order to produce friendly results to domain experts. The ENEM and official school census databases were integrated into data-mart presented in student grain. After the interpretation and modeling of the problem, the data were prepared for different techniques of Artificial Intelligence; inserting, modifying, populating, and deleting variables through context information. The transformation stage also had a supervised procedure of dimensionality reduction that considered the rate of missing values, variance and the correlation between the independent variables. In the construction of the models, the logistic regression technique produced a propensity score for success of students and had your results higher than 0.84 and 0.51 for the metrics AUC_ROC and KS2_MAX, respectively. For the extraction of knowledge in natural language, decision trees constructed sequential conditions and rules were generated through induction based on scores. These techniques were evaluated for the metrics: confidence, support and lift. In the end, it was concluded that the approach presented (Domain-Driven Data Mining) had an excellent result in the modeling and the validation of public policies. 2018-12-05T18:05:13Z 2018-12-05T18:05:13Z 2017-08-18 doctoralThesis https://repositorio.ufpe.br/handle/123456789/28008 por openAccess Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
institution |
REPOSITORIO UFPE |
collection |
REPOSITORIO UFPE |
language |
por |
topic |
Mineração de dados Desempenho escolar |
spellingShingle |
Mineração de dados Desempenho escolar SILVA FILHO, Rogério Luiz Cardoso Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar |
description |
O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas. |
author2 |
ADEODATO, Paulo Jorge Leitão |
format |
doctoralThesis |
author |
SILVA FILHO, Rogério Luiz Cardoso |
author_sort |
SILVA FILHO, Rogério Luiz Cardoso |
title |
Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar |
title_short |
Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar |
title_full |
Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar |
title_fullStr |
Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar |
title_full_unstemmed |
Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar |
title_sort |
modelo de análise e predição do desempenho dos alunos dos institutos federais de educação usando o enem como indicador de qualidade escolar |
publisher |
Universidade Federal de Pernambuco |
publishDate |
2018 |
url |
https://repositorio.ufpe.br/handle/123456789/28008 |
_version_ |
1641987151765700608 |
score |
13.657419 |