基于类别感知课程学习的半监督立场检测
Semi-supervised stance detection based on category-aware curriculum learning作者机构:重庆理工大学计算机科学与工程学院重庆400054
出 版 物:《计算机应用》 (journal of Computer Applications)
年 卷 期:2024年第44卷第10期
页 面:3281-3287页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:重庆市自然科学基金资助项目(CSTB2022NSCQ-MSX1672) 重庆市教育委员会科学技术研究计划重大项目(KJZD-M202201102) 重庆理工大学校级联合资助项目(gzlcx20233248)
摘 要:生成伪标签是半监督立场检测的一种有效策略。在现实应用中,生成的伪标签质量存在差异,然而现有的工作将生成伪标签的质量视为是同等的,且没有充分考虑类别不平衡对伪标签生成质量的影响。为了解决上述2个问题,提出基于类别感知课程学习的半监督立场检测模型(SDCL)。首先,使用预训练分类模型对无标签推文生成伪标签;其次,根据伪标签质量的高低对推文按类别排序,并选取每个类别前k个高质量推文;最后,将各个类别选出的推文合并后重新排序,并把排序后带有伪标签的推文再输入分类模型,从而进一步优化模型参数。实验结果表明,与基线模型中表现最好的SANDS(Stance Analysis via Network Distant Supervision)相比,所提模型在3种不同划分(有标签推文总数为500、1000和1500)情况下,在StanceUS数据集上的宏平均(Mac-F1)分数分别提高了2、1和3个百分点,在StanceIN数据集上的Mac-F1分数均提高了1个百分点,验证了所提模型的有效性。