PROPOSAL OF A TIME SERIES-BASED MODEL FOR THE CHARACTERIZATION AND PREDICTION OF DROPOUT RATES AT THE NATIONAL OPEN AND DISTANCE UNIVERSITY
Main Article Content
Abstract
Dropout rates are a key indicator of educational quality, making it imperative for educational institutions to design strategies to reduce them, thereby contributing to improved student retention and the achievement of academic objectives. While dropout research has primarily focused on machine learning methods applied to in-person education datasets, this article introduces a novel approach based on time series models for dro pout rates analysis at the National Open and Distance University (UNAD). Methodologically, an adaptation of the CRISP-DM methodology was undertaken in four phases, namely: F1. Business and data understanding, F2. Data preparation, F3. Model building and evaluation, and F4. Model deployment. In terms of results, an open dataset on UNAD dropout, ob tained from the SPADIES system between 1999 and 2021, was employed. Using Python libraries statsmodels and pandas, an ARIMA model was implemented, displaying optimal error metrics. This ARIMA model was utilized to forecast future dropout rates at UNAD, projecting a future dropout rate fluctuating around 23%. In conclusion, the ARIMA model developed for UNAD stands as an innovative and essential tool in the educational realm, capable of accurately anticipating dropout rates for upcoming semesters. This provides UNAD with a unique advantage in strategic decision-making.
Article Details
References
Ministerio de Educación Nacional, Deserción estudiantil en la educación superior Colombiana. Ministerio de Educación Nacional, 2009. [Online]. Available: https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_libro_desercion.pdf
K. Y. Romero-Contreras, D. Castillo-Gil, D. J. Higuera-Hurtado, and C. E. Villalba-Gómez, 'Factores influyentes de la deserción estudiantil en la Universidad de La Salle (2018-2020),' Virtu@lmente, vol. 9, no. 2, Apr. 2022, doi: 10.21158/2357514x.v9.n2.2021.3196.
MEN (Ministerio de Educación Nacional), 'Educación Superior.'
R. Vega-García, M. Vázquez-Alamilla, R. Flores-Jiménez, I. Flores-Jiménez, and R. Rodríguez-Moreno, 'Propuesta para analizar la calidad educativa y deserción escolar a nivel superior en el estado de Hidalgo. Caso de un Instituto Tecnológico Superior en el occidente del estado de Hidalgo,' Boletín Científico la Esc. Super. Tlahuelilpan, vol. 2, no. 3, 2014, [Online]. Available: https://www.uaeh.edu.mx/scige/boletin/tlahuelilpan/n3/e6.html
D. Velez, A.; López, 'Estrategias para vencer la deserción universitaria,' Educ. y Educ., vol. 7, 2004.
F. Sáez, Y. López, R. Cobo, and J. Mella, 'Revisión sistemática sobre intención de abandono en educacion superior,' IX Conf. Latinoam. sobre el Abandon. en la Educ. Super., vol. 500, pp. 91-100, 2020.
Ó. Espinoza, L. E. González Fiegehen, and J. Loyola Campos, 'Factores determinantes de la deserción escolar y expectativas de estudiantes que asisten a escuelas alternativas,' Educ. y Educ., vol. 24, no. 1, pp. 113-134, May 2021, doi: 10.5294/educ.2021.24.1.6.
M. Aldeman and M. Szekely, 'An Overview of School Dropout in Central America: Unresolved Issues and New Challenges for Education Progress,' Eur. J. Educ. Res., vol. 6, no. 3, pp. 235-259, Jul. 2017, doi: 10.12973/eu-jer.6.3.235.
A. L. Noltemeyer, R. M. Ward, and C. Mcloughlin, 'Relationship between school suspension and student outcomes: A meta-analysis,' School Psych. Rev., vol. 44, no. 2, pp. 224-240, 2015.
M. Alban and D. Mauricio, 'Neural networks to predict dropout at the universities,' Int. J. Mach. Learn. Comput., vol. 9, no. 2, pp. 149-153, 2019.
E. Cruz, M. González, and J. C. Rangel, 'Técnicas de machine learning aplicadas a la evaluación del rendimiento y a la predicción de la deserción de estudiantes universitarios, una revisión.,' Prism. Tecnológico, vol. 13, no. 1, pp. 77-87, Feb. 2022, doi: 10.33412/pri.v13.1.3039.
J. E. Valero Cajahuanca, Á. F. Navarro Raymundo, A. C. Larios Franco, and J. D. Julca Flores, 'Deserción universitaria: evaluación de diferentes algoritmos de Machine Learning para su predicción,' Rev. ciencias Soc. ISSN-e 1315-9518, Vol. 28, No. 3, 2022, págs. 362-375, vol. 28, no. 3, pp. 362-375, 2022, Accessed: Sep. 11, 2023. [Online]. Available: https://dialnet.unirioja.es/servlet/articulo?codigo=8526463&info=resumen&idioma=ENG
J. O. Gutierrez-Villareal, L. R. Fonseca-Gómez, and W. Pineda-Ríos, 'Estimación de las principales causas de la deserción universitaria mediante el uso de técnicas de machine learning,' Aglala, vol. 12, no. 2, pp. 293-311, 2021, [Online]. Available: https://revistas.curn.edu.co/index.php/aglala/article/view/2105
E. Chinkes, 'Pronósticos y data mining para la toma de decisiones. Pronóstico sobre la deserción de alumnos de una Facultad,' Cuad. del Cimbage, vol. 1, no. 20, pp. 107-132, 2018, [Online]. Available: https://ojs.econ.uba.ar/index.php/CIMBAGE/article/view/1184/1793
K. Rivera Vergaray, 'Modelo predictivo para la detección temprana de estudiantes con alto riesgo de deserción académica,' Innovación y Softw., vol. 2, no. 2, pp. 6-13, Sep. 2021, doi: 10.48168/innosoft.s6.a40.
H. Y. Ayala-Yaguara, G. M. Valenzuela-Sabogal, and A. Espinosa-García, 'Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca,' Rev. ONTARE, no. 7, pp. 134-150, 2019, [Online]. Available: https://dialnet.unirioja.es/servlet/articulo?codigo=8705565
A. Kuz and R. Morales, 'Ciencia de Datos Educativos y aprendizaje automático: un caso de estudio sobre la deserción estudiantil universitaria en México,' Educ. Knowl. Soc., vol. 24, p. e30080, Jun. 2023, doi: 10.14201/eks.30080.
J. Smith Uldall and C. Gutiérrez Rojas, 'An Application of Machine Learning in Public Policy: Early Warning Prediction of School Dropout in the Chilean Public Education System,' Multidiscip. Bus. Rev., vol. 15, no. 1, pp. 20-35, Jun. 2022, doi: 10.35692/07183992.15.1.4.
I. Urteaga, L. Siri, and G. Garófalo, 'Predicción temprana de deserción mediante aprendizaje automático en cursos profesionales en línea,' Rev. Iberoam. Educ. a distancia, vol. 23, no. 2, pp. 169-182, 2020, [Online]. Available: https://redined.educacion.gob.es/xmlui/handle/11162/201572
H. E. Caselli Gismondi and L. V. Urrelo Huiman, 'Características para un modelo de predicción de la deserción académica universitaria. Caso Universidad Nacional de Santa,' LLamkasun Rev. Investig. Científica y Tecnológica, vol. 2, no. 4, pp. 2-22, 2021, [Online]. Available: https://dialnet.unirioja.es/servlet/articulo?codigo=8152475
J. J. Espinosa Zúñiga, 'Aplicación de metodología CRISP-DM para segmentación geográfica de una base de datos pública,' Ing. Investig. y Tecnol., vol. 21, no. 1, pp. 1-13, Jan. 2020, doi: 10.22201/fi.25940732e.2020.21n1.008.
C. A. Dorado Bastidas, E. Y. Córdoba Campos, and G. E. Chanchí Golondrino, 'Dashboard apoyado en inteligencia de negocios para toma de decisiones en el sector salud,' Rev. Gestión y Desarro. Libr., vol. 8, no. 16, pp. 1-13, 2023, doi: https://doi.org/10.18041/2539-3669/gestionlibre.16.2023.10226.
U. Shafique and H. Qaiser, 'A comparative study of data mining process models (KDD, CRISP-DM and SEMMA),' Int. J. Innov. Sci. Res., vol. 12, no. 1, pp. 217-222, 2014.
R. F. Ayala Castrejon and C. Bucio Pacheco, 'Modelo ARIMA aplicado al tipo de cambio peso-dólar en el periodo 2016-2017 mediante ventanas temporales deslizantes,' Rev. Mex. Econ. y Finanz., vol. 15, no. 3, pp. 331-354, Jul. 2020, doi: 10.21919/remef.v15i3.466.