基于混合卷积网络的短文本实体消歧
Mixed Convolution Network Based Entity Disambiguation for Short Text作者机构:新疆大学信息科学与工程学院新疆乌鲁木齐830046 新疆多语种信息技术实验室新疆乌鲁木齐830046 国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地新疆乌鲁木齐830046
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2021年第35卷第11期
页 面:101-108页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(62062062) 新疆大学科研基金(BS 180250)
主 题:短文本 实体消歧 BERT 图卷积网络 卷积神经网络
摘 要:因短文本实体消歧具有不能完整地表达语义关系、上下文提供的信息较少等局限性。针对以上难点,该文提出了一种新的方法,混合卷积网络(Mixed Convolution Network,MCN)。该方法的核心思想是首先对数据集进行预处理;其次,采用Google提出的BERT模型进行特征提取,并通过注意力机制将特征进一步抽取后作为CNN模型的输入,通过CNN模型获得句子的依赖特征。同时,该文使用GCN模型获取语义特征,将二者提取到的语义信息融合,输出得到结果。在CCKS2019评测数据集上的实验结果表明,该文提出的混合卷积网络取得了86.57%的精确率,验证了该模型的有效性。