Por favor, use este identificador para citar o enlazar este ítem: http://dspace.espoch.edu.ec/handle/123456789/19008
Título : Predicción de la situación académica en alumnos de pregrado usando algoritmos de Machine Learning.
Autor : Gamboa Unsihuay, Jesús Eduardo
Salinas Flores, Jesús Walter
Palabras claves : ENSAMBLE;MINERÍA DE DATOS;BORUTA;CORTE ÓPTIMO
Fecha de publicación : 31-ene-2022
Editorial : Escuela Superior Politécnica de Chimborazo
Abstract : The academic performance of a university student is generally measured through their grades, which result in a normal or poor interpretation of the academic performance of the students. The grades, actually depends on various factors. The objective of this research was to find the main predictors of the academic performance of a university student after six semesters since her or his admission. For data analysis, the Boruta algorithm was used to select predictor variables and twelve classification algorithms were applied, after partitioning the data into training and evaluation sets. Then, those models with the best sensitivity, specificity and balanced accuracy values were chosen. Finally, an optimal assembly and cut-off point were used to improve predictions. The models with the best performance were logistic regression, Naive Bayes and vector support machines with linear kernel. The application used ensembles with optimal cut-off point, specificity of 0.695 and sensitivity of 0.947 were obtained. The grade obtained in Mathematics course was one of the most important to predict the academic performance after six semesters of studies, while the sociodemographic variables were not relevant.
Resumen : El rendimiento académico de un estudiante universitario generalmente se mide a través de sus calificaciones,las cuales derivan en una situación académica normal o deficiente, que a su vez depende de diversos factores. El objetivo de esta investigación fue encontrar los principales predictores de la situación académica de un estudiante universitario luego de que transcurrieron seis semestres desde su ingreso. Para el análisis de datos, se hizo uso del algoritmo Boruta para seleccionar variables predictoras y se aplicaron doce algoritmos de clasificación, previa partición de los datos en conjuntos de entrenamiento y evaluación. Luego, se eligieron aquellos modelos con mejores valores de sensibilidad, especificidad y balanced accuracy. Finalmente, se empleó un ensamble y un punto de corte óptimo para mejorar las predicciones. Los modelos con mejor desempeño fueron el de regresión logística, Naive Bayes y máquinas de soporte vectorial con kernel lineal. Al aplicar el ensamble con punto de corte óptimo se obtuvo especificidad de 0.695 y sensibilidad de 0.947. La nota obtenida en el curso de Matemáticas fue una de las más importantes para predecir la situación académica luego de seis semestres de estudios, mientras que las variables sociodemográficas no fueron relevantes.
URI : http://dspace.espoch.edu.ec/handle/123456789/19008
Aparece en las colecciones: Número 27, Vol. 1 (Enero - Junio 2022)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
per_n27_v1_01.pdf520,22 kBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons