Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.espoch.edu.ec/handle/123456789/19008
Título : | Predicción de la situación académica en alumnos de pregrado usando algoritmos de Machine Learning. |
Autor : | Gamboa Unsihuay, Jesús Eduardo Salinas Flores, Jesús Walter |
Palabras claves : | ENSAMBLE;MINERÍA DE DATOS;BORUTA;CORTE ÓPTIMO |
Fecha de publicación : | 31-ene-2022 |
Editorial : | Escuela Superior Politécnica de Chimborazo |
Abstract : | The academic performance of a university student is generally measured through their grades, which result in a normal or poor interpretation of the academic performance of the students. The grades, actually depends on various factors. The objective of this research was to find the main predictors of the academic performance of a university student after six semesters since her or his admission. For data analysis, the Boruta algorithm was used to select predictor variables and twelve classification algorithms were applied, after partitioning the data into training and evaluation sets. Then, those models with the best sensitivity, specificity and balanced accuracy values were chosen. Finally, an optimal assembly and cut-off point were used to improve predictions. The models with the best performance were logistic regression, Naive Bayes and vector support machines with linear kernel. The application used ensembles with optimal cut-off point, specificity of 0.695 and sensitivity of 0.947 were obtained. The grade obtained in Mathematics course was one of the most important to predict the academic performance after six semesters of studies, while the sociodemographic variables were not relevant. |
Resumen : | El rendimiento académico de un estudiante universitario generalmente se mide a través de sus calificaciones,las cuales derivan en una situación académica normal o deficiente, que a su vez depende de diversos factores. El objetivo de esta investigación fue encontrar los principales predictores de la situación académica de un estudiante universitario luego de que transcurrieron seis semestres desde su ingreso. Para el análisis de datos, se hizo uso del algoritmo Boruta para seleccionar variables predictoras y se aplicaron doce algoritmos de clasificación, previa partición de los datos en conjuntos de entrenamiento y evaluación. Luego, se eligieron aquellos modelos con mejores valores de sensibilidad, especificidad y balanced accuracy. Finalmente, se empleó un ensamble y un punto de corte óptimo para mejorar las predicciones. Los modelos con mejor desempeño fueron el de regresión logística, Naive Bayes y máquinas de soporte vectorial con kernel lineal. Al aplicar el ensamble con punto de corte óptimo se obtuvo especificidad de 0.695 y sensibilidad de 0.947. La nota obtenida en el curso de Matemáticas fue una de las más importantes para predecir la situación académica luego de seis semestres de estudios, mientras que las variables sociodemográficas no fueron relevantes. |
URI : | http://dspace.espoch.edu.ec/handle/123456789/19008 |
Aparece en las colecciones: | Número 27, Vol. 1 (Enero - Junio 2022) |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
per_n27_v1_01.pdf | 520,22 kB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons