面向煤矿安全领域的实体识别研究
Research on Named Entity Recognition for Coalmine Safety作者机构:中国矿业大学信息与控制工程学院徐州221116 中国矿业大学经济管理学院徐州221116 淄博矿业集团信息中心淄博255299 中国矿业大学矿山互联网(应用技术)国家地方联合工程实验室徐州221008
出 版 物:《计算机与数字工程》 (Computer & Digital Engineering)
年 卷 期:2023年第51卷第8期
页 面:1881-1887,1913页
学科分类:083002[工学-环境工程] 0830[工学-环境科学与工程(可授工学、理学、农学学位)] 08[工学]
基 金:国家自然科学基金项目(编号:71972176) 中央高校基本科研业务费专项资金项目(编号:2020XGPY03)资助
主 题:煤矿安全 实体识别 实体标注 预训练模型 双向长短期记忆网络 注意力机制
摘 要:煤矿安全领域实体识别是煤矿智能化的重要基础。针对煤矿安全领域无公开标注集且资料信息匮乏等问题,提出一种多轮次半自动化实体标注方法,在显著减少人工标注成本的同时,成功构造了煤矿安全领域的实体数据集。继而借鉴迁移学习的思想,将预训练语言模型RoBERTa作为词嵌入层,由双向长短期记忆网络和条件随机场进行语义解码,同时针对煤矿语料特征稀疏的特点引入注意力机制,进一步增强特征,由此构建了煤矿安全领域实体识别模型。经过实验表明该模型在煤矿安全数据集上的表现优于当下主流实体识别模型。