BEC-BiLSTM:面向危机事件的实时信息推文预测与知识图谱构建算法
作者单位:西安电子科技大学
学位级别:硕士
导师姓名:董学文;董洛兵
授予年度:2022年
学科分类:050302[文学-传播学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 05[文学] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0503[文学-新闻传播学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:内容丰富的推文 Twitter 危机 知识图谱 深度学习
摘 要:在危机情况下,如短期灾难或大流行(新冠肺炎-19)等长期事件,Twitter可能是一个有价值的信息来源。社交媒体通常能以比官方新闻等传统来源快得多的速度提供有关变化的事实,也能提供关于事件的个人观点,如在危机和大规模紧急情况下的观点或独特要求,Twitter正越来越多地被用作一种流行的信息来源,用于交流和分享危机环境下的情况,报告受影响的人员和伤亡情况。该领域的最新研究证实,此类社交媒体信息可用于多项危机应对任务。因此,处理与危机相关的推文并预测信息推文对于改进危机应对和减少人员和财务损失至关重要。尽管社交媒体信息的可用性是巨大的、开放的和免费的,但由于其巨大的容量、多样性、速度、价值和可变性,在理解这些社交媒体数据方面存在很大的局限性。在危机事件期间,人们发布了大量信息和非信息推文。受影响的人员和个人、基础设施损坏、可用性和资源需求都包含在信息性推文中。在紧急情况下,在灾区或其他地方发现的人也会发布大量非信息性推文,这些推文不会向响应者提供重要信息。因此,开发一个可靠检测信息推文的系统至关重要。然而,由于推文长度短、缺乏足够的上下文和单词歧义,很难创建一个准确的模型来识别危机事件中的信息推文和常规推文。考虑到本论文面临的这些挑战,我们提出了一个深度学习模型,用于在危机事件期间从常规推文中预测信息性推文。本文提出的模型称为卷积层双向短时记忆编码器(BEC-Bi LSTM)。该模型包含三层:第一层是用于从推文生成上下文单词嵌入的BERT层,第二层是用于局部特征提取的卷积层,最后一层是用于存储链接提取的上下文特征的Bi LSTM层。除了这篇论文,我们还提出了一个知识图,用于显示相关见解,并在信息丰富的推文上生成实时视觉信息。为了验证我们的模型并将其与同行进行比较,我们在Crisislex-T6数据集上进行了实验。结果清楚地表明,拟议的BEC-Bi LSTM在准确性和F1成绩方面优于同行。