基于教育数据挖掘和机器学习的在线学习者行为探究
作者单位:南京审计大学
学位级别:硕士
导师姓名:刘俊峰
授予年度:2022年
学科分类:12[管理学] 0401[教育学-教育学] 04[教育学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 040110[教育学-教育技术学(可授教育学、理学学位)]
摘 要:在线学习模式与传统的线下授课方式有着巨大的不同,经典的班级授课形式有着较为成熟的评价和预警机制。教育者能够随时洞察学生的课堂状态和学习效果,并基于不同情况实时改变授课方法,对于可能出现的非正常的学习行为,也完全具备提前干预和引导的条件。在线学习模式在这一方面处于天然的劣势,线上的教育者对于学生学习效果的把握往往是滞后的。随着数据挖掘技术和机器学习算法在教育领域的大量应用,基于在线学习者学习数据的各类研究愈发受到重视。本文聚焦于在线学习平台中学习者的学习行为,将数据挖掘技术和机器学习算法运用到在线教育行业中,试图发现不同课程间的潜在联系和学习者普遍的学习规律,为教育教学活动中不同的参与者提供理论支持和决策参考。通过对学习者选课热度和学习热度的综合评价,了解在线学习者的课程倾向与学科热度。运用基于Apriori算法的关联规则模型构建在线学习平台的课程推荐系统,发现了在线课程中计算机科学占据绝对热度且极高的提升度证明了该系统对用户课程注册量的提升具有显著作用。利用用户观看课程视频的时间数据,分析在线学习者的学习活跃度和学习规律,发现他们的在线学习时间存在明显的周期性。为了了解在线学习者的长期学习趋势,以退课行为反映学习者学习的持续性。借助K近邻、决策树、逻辑回归等单一机器学习算法和Bagging、随机森林、XGBOOST、LightGBM等集成学习方法基于视频播放的角度架构在线学习者退课预测模型。研究结果证明了使用视频播放数据预警退课行为的可行性以及集成学习拟合该数据的优越性。