Modelo de predicción para la deserción en la Fundación Universitaria Konrad Lorenz
...
Camargo Mendoza, Jorge Eliecer | 2022
El objetivo y alcance del proyecto de investigación es utilizar modelos de Machine Learning para la predicción de deserción en los estudiantes de pregrado de la Fundación Universitaria Konrad Lorenz, a partir de la sabana de datos del registro académico de la universidad.
Durante la investigación, se empleó la metodología CRISP-DM que consta de seis fases: comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación e implantación. En la primera fase de “compresión del negocio” se determinó la necesidad de la universidad por tener un modelo predictivo que le permita conocer la probabilidad de deserción de los estudiantes. En la segunda fase de “comprensión de los datos”, se realiza la exploración y verificación de la calidad de las tablas. En la tercera fase de “preparación de los datos”, se seleccionan las tablas a trabajar, se realiza la limpieza, se integran los datos y se dispone las tablas finales que entrarán a los modelos, estas tablas quedaron separadas por cada programa de pregrado de la universidad. En la cuarta fase de “modelado” se selecciona las técnicas de modelo y se evalúan los hiperparámetros de los modelos con la validación cruzada. En la quinta fase de “evaluación”, se evalúan los resultados de los modelos a través de las métricas mencionadas, para este caso el mejor modelo resultó ser los bosques aleatorios (Random Forest), con una exactitud superior del 95% para cada programa académico. En la sexta y última fase es la de “implantación” y se propone una arquitectura en nube que tiene como propósito integrar las fuentes y generar las salidas de los modelos para visualizarlos en un reporte.
LEER