基于机器阅读理解的中文命名实体识别方法
Chinese Named Entity Recognition Method Based on Machine Reading Comprehension作者机构:昆明理工大学信息工程与自动化学院昆明650504 昆明理工大学云南省人工智能重点实验室昆明650504
出 版 物:《模式识别与人工智能》 (Pattern Recognition and Artificial Intelligence)
年 卷 期:2020年第33卷第7期
页 面:653-659页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划项目(No.2018YFC0830105,2018YFC0830101,2018YFC0830100) 国家自然科学基金项目(No.61762056,61866020,61761026,61972186)资助
主 题:命名实体识别(NER) 阅读理解 神经网络 双向Transformer编码器(BERT)
摘 要:针对现有命名实体识别方法主要考虑单个句子内的上下文信息,很少考虑文档级上下文影响的问题,文中提出基于机器阅读理解的中文命名实体识别方法,利用阅读理解思想,充分挖掘文档级的上下文特征,支撑实体识别.首先,针对每类实体,将实体识别任务转化为问答任务,构建问题、文本及实体答案三元组.然后,将三元组信息通过双向Transformer编码器进行预训练,再通过卷积神经网络捕捉文档级文本上下文信息.最后通过二进制分类器实现实体答案预测.在MSRA、人民日报公开数据集和自建数据集上的命名实体识别对比实验表明,文中方法性能较优,阅读理解思想对实体识别具有较好的作用.