咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于VAE和GCN的谣言立场分类算法研究 收藏
基于VAE和GCN的谣言立场分类算法研究

基于VAE和GCN的谣言立场分类算法研究

作     者:郭奉琦 

作者单位:中国矿业大学 

学位级别:硕士

导师姓名:孟凡荣

授予年度:2021年

学科分类:050302[文学-传播学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 05[文学] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0503[文学-新闻传播学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:社交网络 谣言立场 变分自动编码器 图卷积神经网络 图谣言立场分类 

摘      要:在当今互联网时代,微博、Twitter、Facebook等社交媒体平台成为信息发起和传播的主要渠道,信息传播的快速性、及时性以及广泛性等给人们的生活带来了很大的便利,但往往也成为了谣言传播(流传时未经证实的消息)的温床,进而影响网络环境的安全,甚至造成社会秩序的混乱。谣言可以分为突发新闻带来的新谣言和一直存在并长期讨论的谣言两类。本文针对这两种类型的谣言特征,探索社交媒体用户对谣言的立场,设计了两种不同的谣言立场分类模型。本文首先针对突发新闻引发的谣言具有发文量少、与之前就存在于社交媒体中的推文关联性弱、数据分布不均衡并且需要尽快进行控制等特点,提出了变分自动编码器-长短时间记忆(Variational Auto-Encoder-Long Short-Term Memory,VAE-LSTM)模型。该模型首先进行数据预处理,清理推文数据后使用Word2Vec模型提取词向量;然后将词向量输入到VAE中进行训练,得到符合简单概率分布的深度特征序列,再结合使用LSTM网络处理向量序列数据。VAE-LSTM模型不需要手动提取或添加特征,训练过程相对简单高效,能够满足突发事件应急处理的时效性和延展性。并且,该模型将数据从复杂的概率分布转化成统一的简单概率分布,再从中采样获取有效的特征,有效解决了评论数据分布不均衡问题,在各项评价指标中都得到了较好的结果。本文还针对长期存在并被一直讨论的谣言具有上下文关联性强、结构信息丰富的特点,提出了图谣言立场分类(Graph Rumor Stance Classification,GRSC)模型。该模型首先将初始推文数据建模成图数据,利用初始数据中包含的回复标签和推文ID构造一一对应的节点对作为图卷积神经网络(Graph Convolutional Networks,GCN)的输入,通过图注意力机制对推文的结构进行图嵌入,再使用Word2Vec模型提取词向量得到文本的词嵌入向量,并将图嵌入和词嵌入向量相结合,最后使用卷积神经网络对得到的向量进行特征提取。GRSC模型通过对每个节点的一阶邻域进行注意力分数聚合,从而能够完整的提取上下文结构信息。实验的对比结果也证明了模型的有效性。设计与实现了谣言立场分类原型系统。针对以上两种不同的谣言类型,以本文的数据集为基础,实现了本文算法的原型系统,该原型系统实现了推文信息展示、推文分类和数据分析结果展示等功能。帮助管理员对推特用户的发言进行分析并及时对有争议的谣言进行处理。本文共包含图35幅,表9个,参考文献83篇。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分