面向嵌套命名实体识别的回归网络方法研究与应用
作者单位:贵州大学
学位级别:硕士
导师姓名:陈艳平
授予年度:2023年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:嵌套命名实体识别 回归网络 多粒度 全长度命名实体识别
摘 要:命名实体识别是自然语言处理领域的基础性任务之一。在自然语言文本中,存在着大量嵌套结构的命名实体。传统方法使用序列标注模型进行实体识别,无法有效识别嵌套结构的命名实体。为了有效的识别嵌套命名实体,本文设计了回归网络模型,该模型能够端到端的识别嵌套结构的实体。本文研究工作可分为以下两个部分介绍:(1)提出基于回归网络(RN)的嵌套命名实体识别模型。该模型首先通过深度神经网络将句子映射到一个饱和的高阶抽象语义表示。然后在这个抽象语义表示上生成候选文本边界框。最后,借鉴图像领域目标检测算法思想,设计基于文本的回归算法,构建了一种端到端的多目标学习框架。该框架可同时预测实体候选的分类分数并细化其在句子中的空间位置,并且可以通过共享参数全局的优化模型。通过实验表明,RN模型在ACE2005中英文数据集上F1值分别优于相关工作约5%和2%,GENIA数据集上也取得了有竞争力的性能。(2)提出基于回归网络的全长度嵌套命名实体识别模型。上一个模型需要枚举大量的文本边框,导致计算复杂度高且无法通过回归识别长实体。然而,现实文本中存在着大量的长实体,若采用上个模型的方法长实体识别时语义弱化严重且生成候选的实体时容易带来计算复杂度高及数据不平衡问题,针对这两个问题,本文在回归网络的基础上,提出了多粒度的全长度嵌套命名实体识别模型,该模型不需要穷举所有可能的候选实体跨度,只需验证一小部分跨度,通过回归操作来识别句子中所有可能的实体。此外,对于长实体,采用多粒度的句子表示来编码不同语义粒度的语义特征。在本文实验中,即使枚举了少量的实体跨度,本文模型仍然具有竞争力,在ACE2005和GENIA数据集上实现了87.35%和80.85%的F1分数。