Minería de datos educativos para mejorar el rendimiento académico: Un caso de estudio en el bachillerato

Autores/as

DOI:

https://doi.org/10.26871/killkana_social.v10i1.1672

Palabras clave:

Aprendizaje Automático, Minería de Datos Educativos, Modelos de Regresión, Rendimiento Académico

Resumen

El bajo desempeño académico es un fenómeno de múltiples causas que no pueden explicarse mediante conexiones lineales entre variables independientes. En este estudio, se asume que los factores contextuales relacionados con el ambiente familiar, desempeño académico y asistencia a la escuela son causas significativas, aunque no únicas, en una red compleja de determinantes individuales, institucionales y estructurales.  Desde un enfoque dialéctico, el estudio del rendimiento académico no se limita a la descomposición analítica de sus elementos, sino que requiere una recomposición sintética. En esta última fase, las contradicciones entre el contexto social, los antecedentes educativos y las condiciones de la escuela se incorporan con totalidad explicativa del fenómeno.  Este estudio se desarrolló con un enfoque cuantitativo, predictivo y explicativo, con un alcance correlacional-explicativo. La población estuvo integrada por estudiantes de bachillerato del sistema educativo en Ecuador, a partir de una muestra extraída de la base de datos del INEVAL. Se utilizaron registros académicos estandarizados y encuestas socioeconómicas como instrumentos, los cuales fueron sometidos a procedimientos de normalización, integración y depuración. Para procesar los datos, se utilizaron árboles de decisión, modelos de regresión lineal, Random Forest y métodos de ensamble. Para la validación se llevó a cabo la precisión predictiva, coeficiente de determinación (R2) e indicadores de error (RMSE). Como premisa mayor se considera el rendimiento académico como producto de varias determinaciones y como premisa menor los factores familiares, la asistencia y el rendimiento previo resultaron ser predictores significativos del desempeño académico, de esta manera actúan como condiciones causales necesarias, pero no suficientes. Los resultados confirman que los modelos de minería de datos posibilitan el reconocimiento de patrones críticos del riesgo académico con un alto grado de precisión, proporcionado pruebas empíricas para la creación de políticas educativas basadas en la predicción, prevención y toma de decisiones estratégicas.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Bai, X., Zhang, F., Li, J., Guo, T., Aziz, A., Jin, A., & Xia, F. (2021). Educational Big Data: Predictions, Applications and Challenges. Big Data Research, 26, 100270. https://doi.org/10.1016/J.BDR.2021.100270

Baig, M. I., Shuib, L., & Yadegaridehkordi, E. (2020). Big data in education: a state of the art, limitations, and future research directions. International Journal of Educational Technology in Higher Education, 17(44), 1–23. https://doi.org/10.1186/s41239-020-00223-0

Bin, L. (2023). Cognitive Web Service-Based Learning Analytics in Education Systems Using Big Data Analytics. International Journal of E-Collaboration, 19(2). https://doi.org/10.4018/IJeC.316658

Bonilla-Jurado, D. (2025). Las tecnologías de la información y la comunicación en los ERP para la gestión empresarial: Un análisis bibliométrico. Ciencias Administrativas, 25, 147–147. https://doi.org/10.24215/23143738E147

Bonilla-Jurado, D., Guevara, C., Ayala-Gavilanes, C., & Lliguisupa-Pastor, M. (2023). The School Dropout: Causes and Effects in University Education. Journal of Higher Education Theory and Practice, 23(18), 162–170. https://doi.org/10.33423/JHETP.V23I18.6629

Bonilla-Jurado, D., & Meléndez, C. (2023). Integración de los Objetivos de Desarrollo Sostenible a la planificación institucional del Instituto Tecnológico Superior España. PLURIVERSIDAD, 11, 101–115. https://doi.org/10.31381/PLURIVERSIDAD11.6278

Bonilla-Jurado, D., Zumba, E., Lucio-Quintana, A., Yerbabuena-Torres, C., Ramírez-Casco, A., & Guevara, C. (2024). Advancing University Education: Exploring the Benefits of Education for Sustainable Development. Sustainability, 16(17), 7847. https://doi.org/10.3390/su16177847

Boughouas, M. L., Kissoum, Y., Mouhssen, A., Karek, M. A., & Mazouzi, S. (2022). Towards a Big Educational Data Analytics. ICAASE 2022 - 5th Edition of the International Conference on Advanced Aspects of Software Engineering, Proceedings. https://doi.org/10.1109/ICAASE56196.2022.9931565

Chen, Y., & Jin, K. (2024). Educational Performance Prediction with Random Forest and Innovative Optimizers: A Data Mining Approach. International Journal of Advanced Computer Science and Applications, 15(3), 69–78. https://doi.org/10.14569/IJACSA.2024.0150308

Fu, Q. (2024). Research on Student Behavior Analysis and Grade Prediction System Based on Student Behavior Characteristics. Scalable Computing: Practice and Experience, 25(1), 217–228. https://doi.org/10.12694/SCPE.V25I1.2286

Garg, A., Garg, N. B., Ghosh, P., Bansal, A., Lilhore, U. K., & Simaiya, S. (2022). A Machine Learning-based Automatic Model to Predicting Performance of Students. Proceedings of 2022 IEEE International Conference on Current Development in Engineering and Technology, CCET 2022. https://doi.org/10.1109/CCET56606.2022.10080607

Grabovy, P., & Siniak, N. (2024). Using AI and big data in decision making: A framework across disciplines. E3S Web of Conferences, 535, 05011. https://doi.org/10.1051/E3SCONF/202453505011

Guevara, C., & Bonilla, D. (2021). Algorithm for Preventing the Spread of COVID-19 in Airports and Air Routes by Applying Fuzzy Logic and a Markov Chain. Mathematics 2021, Vol. 9, Page 3040, 9(23), 3040. https://doi.org/10.3390/MATH9233040

Jha, S., Jha, M., & O’Brien, L. (2018). A Step towards Big Data Architecture for Higher Education Analytics. Proceedings - 2018 5th Asia-Pacific World Congress on Computer Science and Engineering, APWC on CSE 2018, 178–183. https://doi.org/10.1109/APWCONCSE.2018.00036

Kavya, N., Manasa, S., Shrihari, M. R., Manjunath, T. N., & Mahesh, M. R. (2023). The Secured System for Continuous Improvement in Educational Institutes Using Big Data Analytics. Lecture Notes in Networks and Systems, 782 LNNS, 183–195. https://doi.org/10.1007/978-981-99-6568-7_17

Lalaleo-Analuisa, F. R., Bonilla-Jurado, D. M., & Robles-Salguero, R. E. (2021). Information and Communication Technologies exclusively for consumer behavior from a theoretical perspective. Retos(Ecuador), 11(21), 147–163. https://doi.org/10.17163/RET.N21.2021.09

Lou, Y., & Colvin, K. F. (2025). Performance prediction using educational data mining techniques: a comparative study. Discover Education, 4(112). https://doi.org/10.1007/S44217-025-00502-W

Mahalle, P. N., Hujare, P. P., & Shinde, G. R. (2023). Data Acquisition and Preparation. SpringerBriefs in Applied Sciences and Technology, Part F1278, 11–38. https://doi.org/10.1007/978-981-99-4850-5_2

Padmavathi, A., Pandit, B., Khaitan, G., & Varma, S. (2024). UNNATI: Enhancing Quality Education in Rural Areas through AI, AR & digitalization. 2024 2nd International Conference on Advances in Computation, Communication and Information Technology, ICAICCIT 2024, 580–584. https://doi.org/10.1109/ICAICCIT64383.2024.10912363

Patil, S., Patwal, P. S., & Wadane, V. S. (2024). Machine learning approach for educational data mining on real life applications. IET Conference Proceedings, 2024(38), 370–374. https://doi.org/10.1049/ICP.2025.0892

Shylaja, A. R., Shubhashree, D. A., Shrihari, M. R., Manjunath, T. N., & Ajay, N. (2023). Secure Data Education: Leveraging Big Data for Enhanced Academic Performance and Student Success in Educational Institutions. Lecture Notes in Networks and Systems, 754 LNNS, 111–124. https://doi.org/10.1007/978-981-99-4932-8_12

Tin, T. T., Hock, L. S., & Ikumapayi, O. M. (2024). Educational Big Data Mining: Comparison of Multiple Machine Learning Algorithms in Predictive Modelling of Student Academic Performance. International Journal of Advanced Computer Science and Applications, 15(6), 633–645. https://doi.org/10.14569/IJACSA.2024.0150664

Tran, T. T., Phan, N. Q., & Huynh, H. X. (2025). Random Forest Model Parameters Optimization. Communications in Computer and Information Science, 2191 CCIS, 237–247. https://doi.org/10.1007/978-981-97-9616-8_19

Vijayalakshmi, S., & Nivethithaa, K. K. (2021). Survey on Data Mining Techniques, Process and Algorithms. Journal of Physics: Conference Series, 1947(1), 012052. https://doi.org/10.1088/1742-6596/1947/1/012052

Weiser, E. B. (2020). Structural equation modeling in personality research. The Wiley Encyclopedia of Personality and Individual Differences, Measurement and Assessment, 137–142. https://doi.org/10.1002/9781119547167.CH93

Zhang, C., Yang, J., Li, M., & Deng, M. (2024). Simulation-Based Machine Learning for Predicting Academic Performance Using Big Data. International Journal of Gaming and Computer-Mediated Simulations, 16(1). https://doi.org/10.4018/IJGCMS.348052

Publicado

2026-01-25

Cómo citar

Vásquez Ojeda, S., & Pérez Argudo, W. (2026). Minería de datos educativos para mejorar el rendimiento académico: Un caso de estudio en el bachillerato. Killkana Social, 10(1), 48–64. https://doi.org/10.26871/killkana_social.v10i1.1672

Número

Sección

Artículos originales de investigación

Artículos similares

1 2 3 4 5 6 7 8 9 10 > >> 

También puede Iniciar una búsqueda de similitud avanzada para este artículo.