学生评教数据挖掘及教学应用研究
作者单位:河北经贸大学
学位级别:硕士
导师姓名:赵霞
授予年度:2024年
学科分类:040106[教育学-高等教育学] 12[管理学] 0401[教育学-教育学] 04[教育学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:学生评教信度特征 评教信度分类 K-means算法 神经网络算法 Stacking集成学习
摘 要:学生评教数据是教育大数据领域的重要组成部分,在一定程度上反映了教师教学质量。本文针对H大学的真实评教数据,提出十一个描述学生评教信度的特征,然后利用聚类算法确定学生信度等级,再针对剔除敷衍评教数据后的学生评教数据进行聚类分析,实现教师类别数据标注,最后利用分类算法构建教师类别预测模型,利用回归算法构建教师分数预测模型。通过向学生反馈评教信度类别,督促学生认真评教,使学生评教更加客观有效;通过向教师反馈教师类别与评分,督促教师认真教学,及时反思,使学生评教数据发挥作用。论文的主要工作如下: (1)构建学生评教信度特征,对学生评教数据信度分级。对H大学的学生评教数据进行整理,首先对数值型、文本型评教数据进行图表分析,制定能描述学生评教数据客观程度的特征。然后统一数据量纲,分析数据特征之间的相关性,并进行特征选择。使用PCA进行数据提取与可视化,使用K-means算法对学生评教信度数据进行聚类,得到了不同客观程度的学生评教数据。 (2)预测教师类别。提取高客观度的学生评教数据,并运用聚类分析方法识别不同教学水平的教师,为后续分类模型的训练提供了有效的样本数据。根据教师聚类结果,对教师分类。本文使用WOA(Whale Optimization Algorithm)-BPNN(Back propagation neural network,BPNN)算法对教师类别数据进行模型构建。实验结果表明,该模型能有效地进行教师类别预测。 (3)根据课程特征与教师特征,对教师分数预测。利用基于Stacking的回归模型,集成了Ada Boost(Adaptive Boosting,自适应增强)、RF(Random forest,随机森林)、XGBoost(e Xtreme Gradient Boosting,极限梯度提升)、KRR(Kernel Ridge Regression,核岭回归)四种算法,再用Stacking模型与单个学习器Ridge加权组合预测教师分数。实验结果表明,该模型效果优于其他单个模型。