基于文本挖掘的在线课程学习者感知质量评价研究
作者单位:湖南大学
学位级别:硕士
导师姓名:单汨源
授予年度:2021年
学科分类:0401[教育学-教育学] 04[教育学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 040110[教育学-教育技术学(可授教育学、理学学位)] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:文本挖掘 课程感知质量评价 在线课程评论 情感分析 LDA模型
摘 要:随着“互联网+技术对各行业不断渗透,在线教育行业得到迅速发展,尤其在2020新冠疫情影响后,更是得到迅猛发展。同时,互联网巨头的不断加入导致商业模式下的在线教育行业规模不断扩大,竞争越来越激烈。在线教育高速发展的背后存在着学习者粘性低、体验满意度低及多数课程处于休眠状态的问题。如何及时识别学习者需求及态度、提高课程质量及满意度一直以来都是运营商及学者关注的问题。通过传统的调查问卷、专家访谈、文献归纳等自上而下的研究方法获取在线课程感知质量已不能满这一需求。大量积累的学习者评论包含了学习者对在线课程最真实的感知即对课程属性的态度和评价,能够为及时准确地识别学习者需求并对课程感知质量评价提供数据支持。因此,本文以学习者评论为数据来源,提出了基于文本挖掘的方法评价学习者的感知质量。首先,我们利用网络爬虫技术爬取在线课程学习者评论,使用自然语言处理技术(NLP)对学习者评论文本预处理并进行相关基础分析。其次,通过LDA模型对预处理后的数据进行主题因素提取,根据词频统计人工挑选与课程评论相关的特征词并进行归类,利用TF-IDF法对主题因素进行权重计算。然后,基于依存句法原理进行特征词-观点词抽取,并构建了基于情感词典的情感得分计算规则,完成对在线课程学习者感知质量评价。最后,对腾讯课堂互联网课程进行实证分析,得到学习者感知质量评价总得分,根据得分各因素进行分析,并对在线课程运营商提出管理建议。研究结果发现影响在线课程学习者感知质量的因素为课程本身方面、教师特质方面、视频方面四大维度,内容丰富全面性、内容新颖性、内容实用性、课程进度、课程氛围、课程互动、教学态度、教学风格、语速、专业度、语言表达、服务、音质、画质十四个影响因素。其中,内容实用性、语言表达、教学风格、教学态度是学习者关注程度较高且较满意的因素;课程互动、课程进度、授课语速、视频画质是影响学习者不满意的主要因素;学习者对服务和视频音质两个因素的评价分歧较大。本文构建的评价方法有助于运营商及时了解学习者的需求,并为改进课程产品质量、提高学习者满意度提供依据。