咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于特征融合的中文网络谣言检测技术研究与实现 收藏
基于特征融合的中文网络谣言检测技术研究与实现

基于特征融合的中文网络谣言检测技术研究与实现

作     者:姜梦函 

作者单位:战略支援部队信息工程大学 

学位级别:硕士

导师姓名:李邵梅

授予年度:2022年

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:谣言检测 特征融合 深度学习 文本内容特征 Transformer 图像特征 注意力机制 

摘      要:网络谣言是借助网络传播的,含有公众关心的信息且真实性不能很快得到证明或是得不到证明的一种特殊陈述。网络谣言因其传播速度快,传播范围广的特点,被称为信息化时代的一大公害,给社会稳定和国家安全造成了巨大的威胁。为了遏制网络谣言产生的影响和危害,我国政府高度重视,从法规、机制、技术等层面采取了一系列措施,推出了一些专门鉴别谣言的网络平台,但当前这类平台往往需要依赖大量的人工辅助,耗时耗力。所以如何准确高效地自动检测社交网络谣言成为亟待解决的问题。随着深度学习技术的发展及其在自然语言处理领域应用的深入,基于深度学习的谣言检测模型也得到广泛应用,极大提升了谣言检测的效果,成为该领域的主流技术。已有研究有两个特点,一是研究英文谣言检测的多;二是研究纯文本形式谣言检测的多。根据本文依托项目的需求,本文需要研究并实现两种场景下的网络谣言检测,一是纯文本形式的中文网络谣言;二是图文联合的中文网络谣言。调研发现已有研究尚无法完全满足项目需求,为此,本文在对当前主流的网络谣言检测技术进行研究的基础上,提出了满足项目指标要求的两种谣言检测方法,并集成两种检测方法实现了项目中的微博谣言检测系统。具体工作如下:(1)针对只有文字内容的纯文本中文网络谣言形式,提出了基于改进位置编码的中文谣言检测方法。首先,基于Transformer能够同时获取文本上下文语义信息的能力,同时,针对原生Transformer在编码位置信息时不能很好地表达词语之间的相对位置信息和方向信息的不足,对其位置编码进行改进,以提取对网络消息中文本语义信息表征能力更强的文本嵌入;然后,利用原文与转发之间的关系构造图结构,并基于图注意力网络提取图中的传播特征;最后,联合上述两种特征进行谣言检测。在中文微博数据集上的检测结果表明,与其他主流检测方法相比,该方法具有更高的检测精度。(2)针对图文联合的中文网络谣言形式,提出了基于图文语义一致性的中文谣言检测方法。首先,使用深度学习模型分别提取待检测消息中的多层级的文本特征,包括文本词特征、句子特征和情感倾向特征,并联合多个图像检测模型提取图像的语义标签并转化为图像的语义向量和视觉特征;然后,采用注意力机制融合文本的词特征和筛选后的图像语义向量得到图文语义一致性特征;最后,将文本的句子特征、文本的情感倾向特征、图像视觉特征和语义一致性特征拼接起来用于谣言检测。在中文微博数据集上的结果表明,与其他主流方法相比,该方法有效地融合了文本内容特征与图像特征,提高了谣言检测的效果。(3)基于上述两类谣言检测方法实现的谣言检测模型,设计并实现了一个微博谣言检测系统,用于辅助用户对微博信息的真实性进行鉴别。主要包括系统登录模块、数据爬取模块、数据预处理模块、谣言检测模型训练模块和谣言检测模块。系统可以在线爬取微博信息进行检测,也可以离线对收集的微博信息进行检测。首先,判断待检测信息是否为中文数据;然后,根据信息中是否含有图像调用上述两类谣言检测模型进行检测;最后将检测结果显示在前端页面上。测试结果表明,该系统可以实现对微博信息的自动采集和微博中文谣言的检测。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分