基于BERT-BiGA模型的标题党新闻识别研究
Identifying Clickbait with BERT-BiGA Model作者机构:新疆师范大学计算机科学技术学院乌鲁木齐830054
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2021年第5卷第6期
页 面:126-134页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金-新疆联合基金项目(项目编号:U1703261)的研究成果之一
主 题:新闻 标题党识别 中文BERT BiGRU 注意力机制
摘 要:【目的】为了识别网络新闻中的标题党现象,提出一种以中文BERT模型为基础,结合BiGRU和融合注意力机制的标题党新闻检测方法。【方法】该方法使用中文BERT预训练模型作为文本编码器,通过融合注意力机制提取文本特征,最后使用BiGRU直接对新闻标题和新闻内容进行建模,通过它们之间的语义相关度判定是否为标题党。【结果】该方法避免使用文本相似度计算方法中复杂的特征工程和误差二次放大等问题,取得了81%的识别准确率。并且开发浏览器插件为新闻读者实现标题党新闻实时检测。【局限】标题党判别机制只考虑新闻标题和内容,未将阅读数、点赞数和评论等信息纳入计算。【结论】该方法在召回率指标上取得了4%的提升,可以看出该方法对于标题党新闻的特征更敏感。