基于组合深度模型的社交媒体谣言检测
作者单位:云南大学
学位级别:硕士
导师姓名:孔兵
授予年度:2022年
学科分类:050302[文学-传播学] 05[文学] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0503[文学-新闻传播学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:社交媒体时代,人们在网络平台获取和分享信息越来越普遍,这无疑加剧了社交网络的复杂性,伴随而来的是网络上谣言的泛滥。网络谣言会带来诸多社会问题,影响社会稳定与和谐,社交网络上的谣言检测已然成为越来越受到重视的热门研究问题。随着深度学习框架的产生和发展,针对社交平台上网络谣言检测,引入深度学习框架是一个有效的解决办法。从网络信息中获取深层语义信息和文本特征是谣言检测的关键。对于复杂的网络信息来讲,单一方法很难去很好地处理和提取其特征。为了更好地进行社交媒体上谣言的检测,本文从谣言检测流程中的多个角度出发,提出了一种组合深度模型的谣言检测方法。本文的工作重点在于:多模型混合使获取到的文本信息相对多样化,更好地获得深层语义信息和高质量的文本特征,进一步提高谣言检测的准确性。本文主要工作如下:(1)在预训练模型BERT中采用了新的内部学习方式,把源贴和相关的评论看作单个文本块,进行每个文本块的内部学习,并且将每块学习到的内容与预训练模型中表示整个文本语义的[CLS]做交互。(2)对预训练模型的输出结果,根据其特点,使用不同的深度模型进一步学习并且使用Co-Attention进行强化,提高模型性能。具体来讲,使用可以获取局部空间特征的卷积神经网络(CNN)、获取时序特征的双向长短期记忆网络(BiLSTM)和协同注意力(Co-Attention)进一步进行特征学习并优化。组合方法相比单一方法更具有鲁棒性,能获取事件信息中更多的隐藏特征,以此提高谣言检测的准确率。(3)在真实的微博和Twitter数据集上进行实验,证明本文提出的方法相比于基线方法在准确率等方面有不错的检测性能,又通过消融实验展示各部分对模型性能影响的大小,说明所提模型的整体优势和组合设计的合理性。实验表明,组合模型在所用数据集上的检测结果的误差率普遍降到3%左右。