基于深度学习和嵌入表示的知识图谱链接预测方法研究
作者单位:齐鲁工业大学
学位级别:硕士
导师姓名:赵晶
授予年度:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:知识图谱被构想为一个有向图,其中图节点对应真实世界中的事物,边表示事物之间的关系。每两个节点以及它们之间的边,被表示为一个三元组(h,r,t)。这里,h代表头节点,代表尾节点,代表两者间的关系。知识图谱在很多种类的任务中发挥了重要的作用,如知识问答,推荐系统等。常见的知识图谱有:Word Net,Freebase等。然而,目前的知识图谱都遭受着不完整的问题,这个问题催生了链接预测任务的兴起,它通过知识图谱中已经存在的事实来推断潜在的信息,能预测一个三元组的可信度。当前链接预测任务的研究方向往往针对单一的语义信息,并且对于深度神经网络的优化不足。主要存在以下缺点: (1)多数基于张量分解的方法能够良好的学习实体与关系之间的语义关系,然而,这些方法不能结合实体之间的拓扑结构和路径信息,这限制了它们处理复杂知识推理问题的能力。 (2)基于深度卷积神经网络的方法由于简单而有效受到了广泛的研究,然而,深度卷积神经网络会遭遇特征分辨率降低的问题,这是多层最大池化和下采样的重复组合导致的。 为了解决以上两个重点问题,本文的主要研究内容有以下三点: (1)为了解决张量分解方法无法学习实体之间的结构关系的缺点,本文提出一种结构感知增强的多分区嵌入交互模型。该模型利用图注意力网络对实体和关系进行编码,获取相邻节点以及边的信息,以较少的网络层捕捉节点之间的交互。在解码端,该模型使用多分区嵌入交互,将全局嵌入分割成多段局部嵌入,学习嵌入的局部交互信息,实现更准确的建模。 (2)为了解决传统的深度卷积神经网络无法学习知识图谱结构信息,并且会遭遇特征分辨率下降的问题,本文提出一种结构可感知的残差卷积网络模型。该模型利用图卷积神经网络对实体进行编码,赋予边可学习权重,动态调整与相邻节点的交互深度。在深度卷积神经网络中,采用同维度卷积的方式获取嵌入的全局关系和翻译特征,并且采用短路链接以实现残差学习。 (3)为了验证上述模型的有效性,本文在多个流行的知识图谱数据集上进行了完备的实验和分析。根据实验结果,上述模型在MRR、Hits@1、Hits@3、Hits@10等指标上都超过了基线模型。通过完整的消融实验,本文进一步证明了模型创新点的有效性。