Diseño de un Modelo predictivo aplicando Minería de Datos para identificar causas de Deserción Estudiantil Universitaria
Palabras clave:
Minería de Datos, Deserción Escolar, Modelo de predicción, error de clasificaciónResumen
En este artículo se presenta el diseño de un Modelo de predicción desarrollado con técnicas y métodos de Minería de Datos (DM) basadas en reglas de clasificación y selección de atributos. El objetivo es identificar patrones relacionados con los aspectos de mayor influencia en la deserción estudiantil de una Institución de Educación Superior (IES) del estado de México. La investigación inicia con un análisis exploratorio, correlacional y explicativo, guiado por la estrategia de cebolla y el ciclo de vida de un proyecto de DM. Posteriormente, se realiza el entrenamiento del modelo con una muestra de 170 estudiantes, en el que se aplican diferentes algoritmos de clasificación (JRIP, OneR, ZeroR, J48, REPTree) y selección (CfsSubsetEval y BestFirst). Los mejores resultados se obtienen en la identificación de las causas que impactan en la deserción y reprobación escolar en un 66%, con respecto a las causas que reporta la IES y un margen de error del 47% del algoritmo J48 con factor de confianza del 0.60, 0.75 y 1.0. Con el método implementado se logra una aproximación satisfactoria para abordar el fenómeno de la deserción o la reprobación en las Universidades