Histórico da Página
O modelo preditivo é gerado a partir da execução de algoritmos de inteligência artificial, que analisam os dados dos alunos no passado, para aprender os padrões de comportamento desses alunos. Após esse aprendizado, o modelo é utilizado para tentar prever o comportamento dos alunos matriculados na instituição de ensino.
Na Figura 1 podemos observar este processo, descrito detalhadamente logo abaixo.
Figura 1 - Etapas para geração da lista e perfis de prováveis evasores
1) Geração da Base de treinamento e de Teste
Inicialmente, é definido o período que deseja-se identificar os prováveis evasores, que vamos chamar de período de interesse. Sabendo-se o período de interesse, as bases de treinamento e de teste são geradas a partir dos dados de matrícula que antecedem esse período.
Supondo que deseja-se classificar os alunos do ano de 2019 (Figura 2), as bases de dados serão construídas da seguinte forma :
a base de treinamento será composta por dados de matrículas concluídas e canceladas em períodos letivos finalizados até o final do ano de 2017.
a base de teste será composta por dados de matrículas concluídas ou canceladas em períodos letivos pertencentes ao ano de 2018.
Figura 2 - Representação gráfica das bases de treinamento e de teste
2) Geração do Modelo Preditivo
A partir da base de treinamento criada, são utilizadas para identificação dos padrões de comportamento dos alunos e geração do modelo preditivo as seguintes informações:
- Informações Acadêmicas dos alunos:
a) Notas
b) Ausências
c) Carga de Disciplinas
- Informações Financeiras:
a) Pagamentos de Parcelas
- Quais alunos abandonaram a instituição de ensino.
Observação: Um estudante é considerado evasor quando seu último período letivo cursado não corresponde ao último período do seu curso. Considerando um curso de Direito com 10 períodos, por exemplo, um aluno que tem como último registro de matrícula o 9º período no 1º semestre de 2018 seria considerado como evasor neste semestre.
Após o treinamento, o modelo preditivo será capaz de fornecer as seguintes informações:
Classificação, quanto à evasão: onde o modelo preditivo atribui a um estudante uma probabilidade de evasão e determina se ele é um provável evasor;
Classificação, quanto ao perfil evasor: onde o modelo preditivo agrupa os estudantes com perfis semelhantes, considerando suas características acadêmicas e financeiras.
3) Validação do Modelo Preditivo
Uma vez gerado, o modelo preditivo é aplicado na base de teste e os resultados alcançados são comparados com dados reais do passado. Assim, é possível avaliar se o modelo alcançou uma boa precisão.
A precisão é calculada da seguinte forma:
Onde:
a = matrículas em períodos letivos da base de teste que foram canceladas e identificadas corretamente pelo modelo.
b = todas matrículas em períodos letivos da base de teste que foram canceladas.
4) Aplicação do Modelo Preditivo
Caso a precisão alcançada no treinamento seja boa, o modelo preditivo é aplicado nas matrículas do período de interesse, que no nosso exemplo é o ano de 2019.
Com estas informações os gestores da Instituição de Ensino poderão realizar ações para reter estes alunos.
Para identificar as características típicas de um estudante que cancela o curso e um estudante que chega ao final do curso, o mesmo é colocado no centro da análise. Desta forma, detalha-se o perfil destes dois tipos para que seja possível a criação dos modelos de classificação e, por conseguinte, a identificação de potenciais evasores.
Para a construção dos modelos de classificação, uma tabela (constantemente atualizada com base nos registros que atualizam continuamente os modelos de dados anteriormente descritos) é construída e denominada de base de treinamento. Esta tabela possui, em cada linha, todas as características correspondentes a um determinado aluno em um momento específico de sua vida acadêmica. Este momento específico pode ser entendido como um retrato da vida acadêmica do aluno durante a instituição até uma data específica.
Para detalhar o significado da caracterização de um estudante em um determinado momento de sua vida acadêmica, pode-se exemplificar pelo seguinte caso:
Um estudante que iniciou seu curso em janeiro de 2012 e terminou o mesmo em dezembro de 2014, tem a vida acadêmica de três anos. Assim, seleciona-se aleatoriamente um dia neste período de três anos, por exemplo, o dia 01 de Junho de 2014. Este dia específico corresponde ao dia em que o "retrato" estudantil da vida acadêmica do estudante foi registrado. Desta forma, há um comportamento do aluno ao longo do seu período principal a partir de janeiro de 2012 até este dia específico (dia em análise). Esse comportamento é registrado através de atributos de preditores, variáveis calculadas através de modelos de dados e que descrevem as condições dos alunos em relação a todos os fatores que influenciam sua vida acadêmica (comportamental, financeira, acadêmica e geográfica).
Para a construção da base de treinamento, os "retratos" dos alunos que completaram o curso no dia correspondente ao dia de conclusão precisam ser registrados. Além disso, os "retratos" de estudantes que cancelaram o curso também precisam ser considerados na base de treinamento durante os 180 dias anteriores à evasão. Ou seja, para cada aluno que evadiu, há 180 linhas (registros) na base de treinamento onde cada linha corresponde às características da vida acadêmica do aluno até X dias antes da evasão, onde X varia de 0 (dia da evasão) e 180 (180 dias antes da evasão)
A primeira etapa consiste na identificação dos estudantes que já evadiram de cursos da IES e a data de evasão dos mesmos. Este processo encontra-se descrito na Figura 47. (Pedir ao Donato para criar um grafico)