基于局部注意力Seq2Seq的中医文本多标签分类研究
Research on Multi-label Classification of Traditional Chinese Medicine Texts Based on Local Attention Seq2Seq作者机构:江西中医药大学计算机学院江西南昌330004 江西中医药大学岐黄国医书院江西南昌330025
出 版 物:《现代信息科技》 (Modern Information Technology)
年 卷 期:2023年第7卷第17期
页 面:96-101页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(82260988) 江西省自然科学基金(20202BAB202019) 江西省研究生创新专项资金项目(YC2021-S499) 江西中医药大学校级科技创新团队发展计划(CXTD22015)
主 题:多标签分类 中医文本 局部注意力 ALBERT Bi-LSTM LSTM
摘 要:针对传统多标签分类模型未充分考虑文本中临近标签之间存在的复杂关联性问题,提出一种基于局部注意力Seq2Seq的中医文本多标签分类模型。首先利用ALBERT模型提取文本的动态语义向量;然后多层Bi-LSTM构成的编码层用于提取文本间的语义关系;最后解码层中使用多层LSTM的局部注意力,突出文本序列中临近标签之间的相互影响力,以预测多标签序列。在中医数据集上验证方法的有效性,实验结果表明,所提出的算法能够有效捕获标签之间的相关性,适用于中医文本的分类预测。