咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >在线评论可行动信息识别研究 收藏

在线评论可行动信息识别研究

Identifying Actionable Information from Online Reviews

作     者:商丽丽 唐华云 王延昭 左美云 Shang Lili;Tang Huayun;Wang Yanzhao;Zuo Meiyun

作者机构:中央国债登记结算有限责任公司博士后科研工作站北京100033 中国人民大学信息学院北京100871 中债金科信息技术有限公司区块链实验室北京100044 

出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)

年 卷 期:2022年第6卷第12期

页      面:1-12页

核心收录:

学科分类:03[法学] 08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 0306[法学-公安学] 

基  金:绿色发展大数据决策北京市重点实验室基金项目(项目编号:dm202103)的研究成果之一。 

主  题:文本评论 文段模型 自然语言处理 可行动信息 BERT 

摘      要:【目的】以评论文本为研究对象,研究可行动信息识别方法,为实践者发挥自身优势及弥补不足提供行动参考。【方法】将目标任务定义为句子级分类问题,提出一种基于文段的可行动信息识别模型SAII。基于BERT预训练模型对输入句子进行编码,建立词级别的上下文表征;枚举句子中不同范围的文段,引入文段注意力机制生成信息量丰富的文段级表征;为缓解噪声问题,提出多通道文段过滤机制,最大限度地保留接近关键元素原型的文段;融合提纯后的文段表示和上下文表示,自动识别可行动信息。【结果】在两个真实数据集上的实验结果表明,所提模型的效果最佳。与三类基线模型中的最优模型相比,SAII模型在Yelp数据集和RateMDs数据集上的F1指标分别提高7.91个百分点和5.42个百分点;2.10个百分点和2.73个百分点;1.94个百分点和1.46个百分点。【局限】仍需在多领域和多模态数据集上广泛验证模型的有效性。【结论】本文模型具备词级和文段级表征能力,有效提高了识别准确率,推动了用户生成内容的价值实现。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分