咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向不平衡数据的机械设备故障命名实体识别 收藏

面向不平衡数据的机械设备故障命名实体识别

Named Entity Recognition of Mechanical Equipment Failure for Imbalanced Data

作     者:党小超 刘涧 董晓辉 祝忠彦 李芬芳 DANG Xiaochao;LIU Jian;DONG Xiaohui;ZHU Zhongyan;LI Fenfang

作者机构:西北师范大学计算机科学与工程学院甘肃兰州730000 金川集团股份有限公司龙首矿甘肃金昌737103 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2024年第50卷第9期

页      面:104-112页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(62162056) 甘肃省产业支撑计划(021CYZC-06) 

主  题:命名实体识别 不平衡数据 焦点损失函数 机械设备故障 双向长短期记忆网络 条件随机场 

摘      要:命名实体识别作为构建知识图谱的基础任务,其识别效果直接影响知识图谱的质量。在实际生产中,机械故障数据通常包含大量的领域专业词汇,同时实体类型普遍存在分布不平衡的问题,这对准确识别故障实体构成了挑战。通用领域实体识别方法在这一领域效果欠佳,从而降低了知识图谱的质量。为应对上述问题,提出一种融合焦点损失(Focal Loss)函数和专业词典的实体识别方法。该方法使用Focal Loss函数应对实体类型不平衡问题,通过引入平衡因子和调制系数,改进传统的交叉熵损失函数,提升实体识别效果,同时将领域专业词汇嵌入到模型中,进一步提高实体识别性能,这一词典包含机械故障的领域术语,有助于模型更准确地识别机械设备故障命名实体。在自建的矿井提升机实验数据集上进行广泛实验验证,结果证明,融入Focal Loss后模型的F1值比主流模型BERT-BiLSTM-CRF提高了5.57个百分点,相比用于解决数据不平衡的典型方法SMOTE效果更优,在此基础上,通过嵌入领域词典,模型的F1值得到进一步提升,达到89.13%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分