基于XGBoost的学生成绩预测及SHAP特征分析研究
Student Achievement Prediction Model based on XGBoost and SHAP Feature Analysis作者机构:南京信息职业技术学院人工智能学院南京210023
出 版 物:《信息化研究》 (INFORMATIZATION RESEARCH)
年 卷 期:2024年第50卷第3期
页 面:34-40页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:本文对开源学生成绩数据集进行数据挖掘,将机器学习算法应用于学生成绩预测,提出一种基于XGBoost算法的学生成绩预测模型。与传统的机器学习预测模型(决策树、K近邻、支持向量机、逻辑回归、随机森林和AdaBoost)相比较,XGBoost算法预测模型具有良好的预测效果。实验结果表明,其分类准确率达到71.5%,AUC值为0.782。最后引入SHAP模型进行特征信息的解释性分析,归纳总结出学生所在学校、学生缺勤次数以及未来攻读学位的愿望是影响学生成绩好坏的重要因素。