咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的在线社交网络上的科学谣言检测和谣言追踪研究 收藏
基于深度学习的在线社交网络上的科学谣言检测和谣言追踪研究

基于深度学习的在线社交网络上的科学谣言检测和谣言追踪研究

作     者:曾辉 

作者单位:云南大学 

学位级别:硕士

导师姓名:崔晓晖

授予年度:2022年

学科分类:05[文学] 08[工学] 081104[工学-模式识别与智能系统] 0503[文学-新闻传播学] 0811[工学-控制科学与工程] 

主      题:科学谣言检测 谣言追踪 自然语言处理 深度学习 人工智能 

摘      要:随着互联网基础设施和移动互联网技术的发展,在线社交媒体方兴未艾。社交媒体上的海量信息中包含了大量的未经确认或已确认但不为所有用户所知的谣言信息,这些谣言可能会蒙蔽公众的认知,误导人们的生活。本文把在线社交网络上的谣言分为科学谣言和社会谣言两大类。科学谣言是指澄清时需要相应的专业知识的谣言,除此之外的谣言归结为社会谣言。针对使用技术手段进行科学谣言检测、科学谣言数据量的匮乏限制了检测模型的能力、谣言追踪等本文进行了深入的探索。本文的主要工作如下:1)本文提出了科学谣言相对影响力指标用于量化在线社交网络上科学谣言的影响力,这可以证明使用技术手段对科学谣言进行检测的必要性。量化科学谣言的影响力并探索使用技术手段检测科学谣言尚属于空白的领域。2)本文构建了一个用于进行科学谣言检测的数据集,其中包含三类数据:科学谣言、社会谣言和非谣言文本。据作者所知,这是第一个用于科学谣言检测的数据集。3)本文基于长短期记忆网络(Long Short-term Memory,LSTM)提出了一个模型用于科学谣言检测。本文的工作可以为在线社交网络上科学谣言的检测提供一个基准,本文提出的模型与多个基线模型相比体现了极大的竞争力。4)针对科学谣言数据缺乏的问题,本文提出从生成科学谣言的角度来检测科学谣言。本文基于Transformer和LSTM模型提出了一个科学谣言生成模型,并借用生成的数据来提高检测模型的能力。本文提出的模型可以在词汇表空间中采样并生成语义连贯的科学谣言,生成的数据对于所有的检测模型都有显著的促进作用。此外,本文的模型摆脱了基于编辑的模型必须指定编辑次数的局限性。5)本文基于对比学习和BERT模型提出了Sim CLRT模型用于谣言追踪,Sim CLRT包含Sim CLRT-CNN,Sim CLRT-RNN,Sim CLRT-Linear三种变体。Sim CLRT不仅可以对含有推文数量较多的事件进行追踪,并且可以对含有推文数量较少的事件倾注足够多的关注。Sim CLRT在本文所用的两个通用谣言追踪数据集上取得了最先进的结果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分