咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向微博突发事件的检测与跟踪研究 收藏
面向微博突发事件的检测与跟踪研究

面向微博突发事件的检测与跟踪研究

作     者:王雪颖 

作者单位:新疆大学 

学位级别:硕士

导师姓名:杨文忠

授予年度:2020年

学科分类:05[文学] 08[工学] 081203[工学-计算机应用技术] 0503[文学-新闻传播学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:突发事件检测 文本聚类 突发事件跟踪 文本分类 

摘      要:随着近年来社交媒体的普及,人们交流和获取信息的便利性有了大幅度的提升,人们进入了一个全新的媒体时代。以微博为代表的社交媒体平台更是凭借其发布、分享、传播信息的便捷性,成为了大多数网民首选社交平台。由于微博具有较强的及时性和传播性,信息在微博上的传播速度会很快,其中不乏有一些暴力恐怖等事件,如果某件受广大民众关注的话题对公共安全有一定风险,则可能会演变成突发事件。为了能够实时的在微博的海量信息中发现舆情并及时地对民众言论进行管控和疏导,因而面向社交网络中突发事件检测和跟踪研究对社会稳定有着重要意义。由于微博的每条文本较短、用词较随意等原因,一般的话题检测技术在微博突发事件检测上的应用效果并不好。因此,本文根据微博文本的特征,提出一种简单有效的针对微博突发事件的检测和跟踪算法。主要工作如下:(1)微博预处理。微博的使用人群范围广,发布的信息数量巨大,内容繁多复杂。为了提高事件的检测效率,通过分析使用用户的特点,过滤掉微博中僵尸用户;通过分析微博中的文本特点,对文本进行分词、去停用词等处理后,删除过短的无意义文本,有效的降低计算的复杂度。(2)突发事件的检测。通过研究突发事件的特点,提出基于多特征的突发事件提取算法。首先是通过情感倾向分析保留包含负面情感的文本,然后采用提出的用户影响力计算方法并结合突发词特征来提取突发词,最后构建突发词集并对其进行层次聚类,从中提取突发事件。(3)突发事件的跟踪。结合了BERT(Bidirectional Encoder Representations from Transformers)语言模型和Text CNN(Text Convolutional Neural Networks)模型来对微博文本进行文本分类。首先采用BERT模型对文本进行预训练得到的文本表示用于Text CNN模型的输入来进一步提取文本的特征,输出结果接入Softmax分类器做分类,从而实现了微博文本的跟踪。通过实验对比分析,基于多特征的突发事件检测算法能有效地提高突发事件检测的准确率;突发事件跟踪方面,结合BERT和Text CNN的分类模型也在各方面都有较好的表现。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分