基于KMeans-EDA算法的非均衡评论情感分类研究
Research on non-balanced sentiment classification based on KMeans-EDA algorithm作者机构:安徽外国语学院信息与数学学院安徽合肥231200
出 版 物:《山东理工大学学报(自然科学版)》 (Journal of Shandong University of Technology:Natural Science Edition)
年 卷 期:2024年第38卷第4期
页 面:45-52页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:安徽省高等学校自然科学研究项目(KJ2020A0818) 安徽外国语学院科研重点项目(AWky2020012)
主 题:在线课程 评论文本 文本情感分类 预训练特征表示 非均衡训练
摘 要:学习者真实的评价是反映在线课程优缺点的重要指标,快速准确地获得其反馈,对于在线课程的优化极为重要。为深入挖掘学习者的在线学习行为,继而为在线教学提供有效的数据基础,爬取了中国大学MOOC平台的课程评论文本,基于Bert模型的结构,建立了基于自注意力文本表征的机器学习模型,能够实现对评论文本的精确情感分类,从而获得学习者内隐的情感状态。由于爬取数据中负面评论较少,故设计了KMeans-EDA自适应均衡采样训练策略,解决了训练过程中模型偏向多数类的问题,提升了模型对负面评论的识别能力。实验结果表明,该策略可以将模型对评论文本的F1-score值从0.6902提升到0.7399。