基于平移模型的知识图谱补全算法研究
作者单位:华中科技大学
学位级别:硕士
导师姓名:李国徽
授予年度:2019年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:知识图谱从互联网上海量信息中抽取出知识,将其组织成三元组形式的结构化数据,便于计算机高效处理,广泛应用于信息检索、智能推荐、问答系统等领域。目前已构建的大规模知识图谱中收录了大量知识信息,但它们仍然是不完备的,有很多信息缺失,致力于完善知识图谱的补全算法成为一个研究热点。知识表示学习是实现知识图谱补全的高效手段,它将知识图谱中实体和关系表示成低维稠密向量,以向量计算的方式推理潜在的语义联系,使计算复杂度大大降低。近年来,涌现了大量知识表示学习的研究成果,其中以TransE模型最具代表性,它开创性地提出平移转换的规则,简化了实体和关系的联系,显著提升了知识图谱补全的效果。深入研究了TransE模型和以它为基础的扩展模型。针对TransE较难处理复杂关系的情况,设计了以关系权重的方式处理三元组的WTransE模型,使实体在不同关系的平移操作中能够体现出不同的语义。同时,还将实体相似度融入到模型中,保证嵌入后的向量较好地保留原有相似性特征,提高嵌入向量的表征能力。实体相似度从两个方面考虑,一个是从三元组结构中挖掘的相似性特征,一个是利用实体文本描述的相似性。对提出的模型和方法在标准数据集上进行了链接预测和三元组分类等知识图谱补全任务的实验,实验证实WTransE模型性能较TransE有较大的提升,同时融入实体相似度的方法能使模型性能进一步提升,表明WransE模型与融入实体相似度的方法是有效可行的。