基于PATCHY-SAN模型的图数据分类算法研究
作者单位:中国石油大学(北京)
学位级别:硕士
导师姓名:吴卫江;蒋先艺
授予年度:2022年
学科分类:07[理学] 070104[理学-应用数学] 0701[理学-数学]
主 题:多指标融合 节点重要性 PATCHY-SAN模型 图分类 节点分类
摘 要:图数据在实际生活中广泛存在,如常见的交通网络、社交网络等,对图数据进行分类一直是该领域的一个热点问题,常见的图数据分类问题通常包括图分类和节点分类。目前深度学习技术在图数据上的应用取得了很多重要的成果。如PATCHY-SAN(Select-Assemble-Normalize)模型就是一个与深度学习相结合的图数据处理框架,该模型在图分类任务中表现出较高的性能,但是该模型仍然存在部分问题,如中心节点选择步骤采用单一的中心性指标作为衡量标准,具有一定局限性;此外,该模型作者只对该模型在图分类任务上的性能进行了研究,未曾将PATCHY-SAN模型应用于节点分类任务。针对以上问题,本文主要做了以下三部分研究:针对单一中心性指标较为局限的情况,本文提出了多中心性指标融合的节点重要度识别算法。该算法对中介中心性、度中心性、紧密度中心性以及特征向量中心性四个常用指标进行相似与互补关系分析后,将四个指标有针对性地分为两组,并为每组添加调节因子,以便灵活地应对不同结构的网络。最终实验表明,与单一中心性指标相比,本文提出的多中心性指标融合的节点重要度识别算法能够表现出更好的性能。为了提高图分类的准确率,本文将多中心性指标融合的节点重要度识别算法应用到基于PATCHY-SAN模型的图分类算法中心节点选择步骤中,并探索不同调节因子对图分类结果的影响。最终实验表明,采用多中心性指标融合的节点重要度识别算法可以较为明显地提升图分类的准确率。最后,本文提出了基于PATCHY-SAN模型的节点分类算法,探索性地将PATCHY-SAN模型为中心节点构建邻域部分调整为给每个节点构建邻域,由此可以将节点自身的属性、邻居节点的属性以及网络的部分拓扑结构结合起来作为节点的特征表示,并将调整后的PATCHY-SAN模型应用到属性图的节点分类任务中。最终实验表明,基于PATCHY-SAN模型的节点分类算法在中小规模网络中能够表现出较好的性能。