咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于标签概念的多标签文本分类方法 收藏

基于标签概念的多标签文本分类方法

Multi-Label Text Classification Method Based on Label Concept

作     者:汪乐乐 张贤坤 WANG Lele;ZHANG Xiankun

作者机构:天津科技大学人工智能学院天津300457 

出 版 物:《天津科技大学学报》 (Journal of Tianjin University of Science & Technology)

年 卷 期:2024年第39卷第1期

页      面:73-80页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:天津市科技计划项目(21ZYQCSY00050) 

主  题:标签概念 全局关键信息 对比损失 多标签文本分类 

摘      要:多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用词频和潜在狄利克雷分布(latent Dirichlet allocation,LDA)方法从训练集全体实例中抽取各标签所对应的关键词,接着采取与文本编码相同方式对关键词编码,获得标签概念表示。在训练和预测过程中,检索与文本表示最相似的标签概念辅助分类,增加标签概念表示与文本表示的对比损失,使文本编码过程中能充分学习全局的标签概念信息。将本文方法嵌套在常用的多标签文本分类模型上进行实验,结果表明该方法有效提高了相应模型的性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分