Minería de datos educativos para mejorar el rendimiento académico: Un caso de estudio en el bachillerato
DOI:
https://doi.org/10.26871/killkana_social.v10i1.1672Palabras clave:
Aprendizaje Automático, Minería de Datos Educativos, Modelos de Regresión, Rendimiento AcadémicoResumen
El bajo desempeño académico es un fenómeno de múltiples causas que no pueden explicarse mediante conexiones lineales entre variables independientes. En este estudio, se asume que los factores contextuales relacionados con el ambiente familiar, desempeño académico y asistencia a la escuela son causas significativas, aunque no únicas, en una red compleja de determinantes individuales, institucionales y estructurales. Desde un enfoque dialéctico, el estudio del rendimiento académico no se limita a la descomposición analítica de sus elementos, sino que requiere una recomposición sintética. En esta última fase, las contradicciones entre el contexto social, los antecedentes educativos y las condiciones de la escuela se incorporan con totalidad explicativa del fenómeno. Este estudio se desarrolló con un enfoque cuantitativo, predictivo y explicativo, con un alcance correlacional-explicativo. La población estuvo integrada por estudiantes de bachillerato del sistema educativo en Ecuador, a partir de una muestra extraída de la base de datos del INEVAL. Se utilizaron registros académicos estandarizados y encuestas socioeconómicas como instrumentos, los cuales fueron sometidos a procedimientos de normalización, integración y depuración. Para procesar los datos, se utilizaron árboles de decisión, modelos de regresión lineal, Random Forest y métodos de ensamble. Para la validación se llevó a cabo la precisión predictiva, coeficiente de determinación (R2) e indicadores de error (RMSE). Como premisa mayor se considera el rendimiento académico como producto de varias determinaciones y como premisa menor los factores familiares, la asistencia y el rendimiento previo resultaron ser predictores significativos del desempeño académico, de esta manera actúan como condiciones causales necesarias, pero no suficientes. Los resultados confirman que los modelos de minería de datos posibilitan el reconocimiento de patrones críticos del riesgo académico con un alto grado de precisión, proporcionado pruebas empíricas para la creación de políticas educativas basadas en la predicción, prevención y toma de decisiones estratégicas.
Descargas
Citas
Bai, X., Zhang, F., Li, J., Guo, T., Aziz, A., Jin, A., & Xia, F. (2021). Educational Big Data: Predictions, Applications and Challenges. Big Data Research, 26, 100270. https://doi.org/10.1016/J.BDR.2021.100270
Baig, M. I., Shuib, L., & Yadegaridehkordi, E. (2020). Big data in education: a state of the art, limitations, and future research directions. International Journal of Educational Technology in Higher Education, 17(44), 1–23. https://doi.org/10.1186/s41239-020-00223-0
Bin, L. (2023). Cognitive Web Service-Based Learning Analytics in Education Systems Using Big Data Analytics. International Journal of E-Collaboration, 19(2). https://doi.org/10.4018/IJeC.316658
Bonilla-Jurado, D. (2025). Las tecnologías de la información y la comunicación en los ERP para la gestión empresarial: Un análisis bibliométrico. Ciencias Administrativas, 25, 147–147. https://doi.org/10.24215/23143738E147
Bonilla-Jurado, D., Guevara, C., Ayala-Gavilanes, C., & Lliguisupa-Pastor, M. (2023). The School Dropout: Causes and Effects in University Education. Journal of Higher Education Theory and Practice, 23(18), 162–170. https://doi.org/10.33423/JHETP.V23I18.6629
Bonilla-Jurado, D., & Meléndez, C. (2023). Integración de los Objetivos de Desarrollo Sostenible a la planificación institucional del Instituto Tecnológico Superior España. PLURIVERSIDAD, 11, 101–115. https://doi.org/10.31381/PLURIVERSIDAD11.6278
Bonilla-Jurado, D., Zumba, E., Lucio-Quintana, A., Yerbabuena-Torres, C., Ramírez-Casco, A., & Guevara, C. (2024). Advancing University Education: Exploring the Benefits of Education for Sustainable Development. Sustainability, 16(17), 7847. https://doi.org/10.3390/su16177847
Boughouas, M. L., Kissoum, Y., Mouhssen, A., Karek, M. A., & Mazouzi, S. (2022). Towards a Big Educational Data Analytics. ICAASE 2022 - 5th Edition of the International Conference on Advanced Aspects of Software Engineering, Proceedings. https://doi.org/10.1109/ICAASE56196.2022.9931565
Chen, Y., & Jin, K. (2024). Educational Performance Prediction with Random Forest and Innovative Optimizers: A Data Mining Approach. International Journal of Advanced Computer Science and Applications, 15(3), 69–78. https://doi.org/10.14569/IJACSA.2024.0150308
Fu, Q. (2024). Research on Student Behavior Analysis and Grade Prediction System Based on Student Behavior Characteristics. Scalable Computing: Practice and Experience, 25(1), 217–228. https://doi.org/10.12694/SCPE.V25I1.2286
Garg, A., Garg, N. B., Ghosh, P., Bansal, A., Lilhore, U. K., & Simaiya, S. (2022). A Machine Learning-based Automatic Model to Predicting Performance of Students. Proceedings of 2022 IEEE International Conference on Current Development in Engineering and Technology, CCET 2022. https://doi.org/10.1109/CCET56606.2022.10080607
Grabovy, P., & Siniak, N. (2024). Using AI and big data in decision making: A framework across disciplines. E3S Web of Conferences, 535, 05011. https://doi.org/10.1051/E3SCONF/202453505011
Guevara, C., & Bonilla, D. (2021). Algorithm for Preventing the Spread of COVID-19 in Airports and Air Routes by Applying Fuzzy Logic and a Markov Chain. Mathematics 2021, Vol. 9, Page 3040, 9(23), 3040. https://doi.org/10.3390/MATH9233040
Jha, S., Jha, M., & O’Brien, L. (2018). A Step towards Big Data Architecture for Higher Education Analytics. Proceedings - 2018 5th Asia-Pacific World Congress on Computer Science and Engineering, APWC on CSE 2018, 178–183. https://doi.org/10.1109/APWCONCSE.2018.00036
Kavya, N., Manasa, S., Shrihari, M. R., Manjunath, T. N., & Mahesh, M. R. (2023). The Secured System for Continuous Improvement in Educational Institutes Using Big Data Analytics. Lecture Notes in Networks and Systems, 782 LNNS, 183–195. https://doi.org/10.1007/978-981-99-6568-7_17
Lalaleo-Analuisa, F. R., Bonilla-Jurado, D. M., & Robles-Salguero, R. E. (2021). Information and Communication Technologies exclusively for consumer behavior from a theoretical perspective. Retos(Ecuador), 11(21), 147–163. https://doi.org/10.17163/RET.N21.2021.09
Lou, Y., & Colvin, K. F. (2025). Performance prediction using educational data mining techniques: a comparative study. Discover Education, 4(112). https://doi.org/10.1007/S44217-025-00502-W
Mahalle, P. N., Hujare, P. P., & Shinde, G. R. (2023). Data Acquisition and Preparation. SpringerBriefs in Applied Sciences and Technology, Part F1278, 11–38. https://doi.org/10.1007/978-981-99-4850-5_2
Padmavathi, A., Pandit, B., Khaitan, G., & Varma, S. (2024). UNNATI: Enhancing Quality Education in Rural Areas through AI, AR & digitalization. 2024 2nd International Conference on Advances in Computation, Communication and Information Technology, ICAICCIT 2024, 580–584. https://doi.org/10.1109/ICAICCIT64383.2024.10912363
Patil, S., Patwal, P. S., & Wadane, V. S. (2024). Machine learning approach for educational data mining on real life applications. IET Conference Proceedings, 2024(38), 370–374. https://doi.org/10.1049/ICP.2025.0892
Shylaja, A. R., Shubhashree, D. A., Shrihari, M. R., Manjunath, T. N., & Ajay, N. (2023). Secure Data Education: Leveraging Big Data for Enhanced Academic Performance and Student Success in Educational Institutions. Lecture Notes in Networks and Systems, 754 LNNS, 111–124. https://doi.org/10.1007/978-981-99-4932-8_12
Tin, T. T., Hock, L. S., & Ikumapayi, O. M. (2024). Educational Big Data Mining: Comparison of Multiple Machine Learning Algorithms in Predictive Modelling of Student Academic Performance. International Journal of Advanced Computer Science and Applications, 15(6), 633–645. https://doi.org/10.14569/IJACSA.2024.0150664
Tran, T. T., Phan, N. Q., & Huynh, H. X. (2025). Random Forest Model Parameters Optimization. Communications in Computer and Information Science, 2191 CCIS, 237–247. https://doi.org/10.1007/978-981-97-9616-8_19
Vijayalakshmi, S., & Nivethithaa, K. K. (2021). Survey on Data Mining Techniques, Process and Algorithms. Journal of Physics: Conference Series, 1947(1), 012052. https://doi.org/10.1088/1742-6596/1947/1/012052
Weiser, E. B. (2020). Structural equation modeling in personality research. The Wiley Encyclopedia of Personality and Individual Differences, Measurement and Assessment, 137–142. https://doi.org/10.1002/9781119547167.CH93
Zhang, C., Yang, J., Li, M., & Deng, M. (2024). Simulation-Based Machine Learning for Predicting Academic Performance Using Big Data. International Journal of Gaming and Computer-Mediated Simulations, 16(1). https://doi.org/10.4018/IJGCMS.348052
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2026 Santiago Vásquez Ojeda, Washington Pérez Argudo

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Se autoriza la reproducción total y parcial, y la citación del material que aparece en la revista, siempre y cuando se indique de manera explícita: nombre de la revista, nombre del autor(es), año, volumen, número y páginas del artículo fuente. Las ideas y afirmaciones consignadas por los autores están bajo su responsabilidad y no interpretan necesariamente las opiniones y políticas del Consejo Editorial de la Revista Killkana Sociales ni de la Universidad Católica de Cuenca.
La Revista Killkana Sociales utiliza la Licencia Creative Commons de Reconocimeinto-NoComercial-CompartirIgual 4.0, que es la siguiente: CC BY-NC-SA 4.0 Internacional.






