基于多尺度结构的网络嵌入算法研究
作者单位:重庆大学
学位级别:硕士
导师姓名:葛亮
授予年度:2023年
学科分类:07[理学] 070104[理学-应用数学] 0701[理学-数学]
主 题:面向角色的网络嵌入 度分布 结构角色特征 聚类 目标分布约束
摘 要:在网络分析中,角色是指节点间的关系模式,而节点的角色往往与其功能相关。因此识别网络中节点的角色有助于更好地理解网络中实体的功能或行为、分析网络的属性和演化。基于此,旨在为网络中的节点学习表示向量的面向角色网络嵌入方法成为了研究热点。面向角色网络嵌入的核心问题包括:(1)如何提取高质量的局部结构特征:局部结构特征作为大多数方法的输入或训练指导信息,提取高质量的局部结构特征成为学习到有效节点表示的关键;(2)如何捕获全局的结构角色特征:现有大多数方法仅识别局部结构而忽略全局的结构角色,导致节点表示的表达能力不足。为此,本文提出了基于多尺度结构的网络嵌入方法。本文的主要工作如下:(1)针对以上核心问题,本文提出基于节点局部结构及其共性的网络嵌入模型(ReVaC)。首先设计了特征提取模块,该模块将节点局部邻域的度数分布引入Re Fe X的递归过程,然后通过保留多阶的度数分布来获取更细粒度的局部结构特征。同时,该模块利用变分自编码器来去除噪声捕获鲁棒的局部结构嵌入。其次,提出了共性建模模块,该模块在局部结构嵌入空间利用聚类来建模相似节点的共性关系,捕获全局的结构角色的特征表示。为保留多尺度结构信息、提高节点表示的表达能力,该模型将局部结构嵌入和结构角色特征进行融合编码,最终得到节点表示。在真实数据集上的实验表明,该模型在节点分类、节点聚类、Top-K相似性搜索等任务上的性能比经典或最新方法有显著提升。此外,模型的计算时间成本分析实验表明,该模型具有低计算时间成本且可拓展到大型数据集的特点。(2)为进一步提升ReVaC模型捕获更具代表性的结构角色特征的能力,本文提出了基于目标分布特征约束的网络嵌入模型(ReVaC-DC)。该模型设计了一个目标分布约束模块,并将其作用于捕获局部结构嵌入的特征提取模块中,以此约束变分自编码器训练。在该模块中,首先基于局部结构的特征和嵌入捕获目标分布特征;其次,通过添加结构损失和聚类损失来迭代细化相似节点间的距离,使得相似节点在嵌入空间中保持相似约束关系且距离更近,这有利于捕获更具代表性的结构角色特征。在真实数据集上的各项实验结果表明,ReVaC-DC获得了比ReVaC模型和基线方法更优越的性能,且同样具有低计算时间成本、拓展到大型数据集的特点。