咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向长尾分布的民众诉求层次多标签分类模型 收藏

面向长尾分布的民众诉求层次多标签分类模型

作     者:刘昕 杨大伟 邵长恒 王海文 庞铭江 李艳茹 

作者机构:青岛大学计算机科学技术学院 中国石油大学(华东)青岛软件学院计算机科学与技术学院 

出 版 物:《计算机应用》 (Journal of Computer Applications)

年 卷 期:2024年

学科分类:12[管理学] 1204[管理学-公共管理] 120401[管理学-行政管理] 08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目(62071491) 山东省自然科学基金资助项目(ZR2020MF045) 

主  题:接诉即办 智能派单 层次多标签分类 先验知识 长尾分布 编解码器 

摘      要:接诉即办是实现社会治理智能化、提高人民满意度的重要举措。精准分析民众诉求以智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键。然而,民众诉求数据中诉求描述不清晰、类别混淆且比例失衡,导致诉求类别分析困难,降低了智能派单的效率与准确性。针对上述问题,提出了编解码器结构的诉求层次多标签分类模型。首先,在文本编码器中引入诉求领域中细粒度的关键词先验知识抑制噪声干扰,同时融合诉求的时空信息提高语义特征判别力;其次,利用标签层次结构生成具有层次与语义感知的标签嵌入,构建基于Transformer模型的标签解码器,利用诉求的语义特征和标签嵌入进行标签解码,在标签的层级依赖关系基础上引入动态标签表策略限制标签的解码范围以解决标签不一致问题;最后,采用Softmax分组策略将样本数量相近的标签类别分为同组来进行Softmax操作,缓解由标签长尾分布导致分类准确率低的问题。在Hotline、RCV1(Reuters Corpus Volume I)-v2和WOS(Web Of Science)数据集上的实验结果表明,相较于基线模型HiMatch(Hierarchyaware label semantics Matching network),所提模型的微F1值提高了1.65、2.06和0.43个百分点,验证了模型的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分