咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种半监督金融事件多标签分类方法 收藏

一种半监督金融事件多标签分类方法

Semi-supervised Multi-label Classification Method for Financial Events

作     者:杨卓峰 李旸 李德玉 YANG Zhuofeng;LI Yang;LI Deyu

作者机构:山西大学计算机与信息技术学院太原030006 山西财经大学金融学院太原030006 计算智能与中文信息处理教育部重点实验室(山西大学)太原030006 

出 版 物:《数据采集与处理》 (Journal of Data Acquisition and Processing)

年 卷 期:2024年第39卷第2期

页      面:385-394页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(62106130,62072294) 山西省青年科学研究项目(20210302124084) 山西省高等学校科技创新项目(2021L284) 

主  题:金融文本 金融事件 多标签分类 半监督方法 注意力机制 

摘      要:随着数字金融服务业的不断发展,互联网和金融服务系统积累了海量文本数据,对金融文本中描述的金融事件自动分类是金融科技的现实需求,也是自然语言处理和机器学习领域广泛关注的方向。目前,深度学习方法已在文本分类中广泛应用,针对文本数据中的金融事件多标签分类中存在的已标注数据缺少、已有深度学习方法消耗资源大以及现有方法未利用金融事件文本的具体特点等问题,通过采用ALBERT和TextCNN等表示工具,引入主体词注意力机制,提出了一种半监督金融事件多标签分类方法。首先,通过无监督数据增强(Unsupervised data augmentation,UDA)方法缓解标注数据量不足的问题;其次,引入了主体词注意力机制,使用ALBERT动态词向量表征方法对文本中的词进行表示;然后,利用TextCNN对文本进行综合语义表示;最后,分别采用交叉熵和KL散度度量标记数据和无标记数据的损失来训练模型。在金融文本数据集上验证了本文所提方法的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分