咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于属性融合的图挖掘算法研究 收藏
基于属性融合的图挖掘算法研究

基于属性融合的图挖掘算法研究

作     者:陈文龙 

作者单位:电子科技大学 

学位级别:硕士

导师姓名:徐杰

授予年度:2017年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:数据挖掘 属性融合 图聚类 仿射传播聚类算法 自适应权重分配 

摘      要:随着当前互联网的快速发展,社交网络和人们日常生活的丰富,数据所呈现出来的结构也变得越来越复杂,以图模型为代表的数据类型也应运而生。这类数据不但包括对象之间的相互关系特征,也包含了数据自身的基本属性。为了从海量的图结构化数据中挖掘出有用知识,研究者开始广泛研究这种带节点属性的图的聚类技术。图聚类作为数据挖掘领域一个新的研究方向,有着重要的研究意义。目前的图聚类算法大多是基于图数据的拓扑结构或图数据的节点属性进行聚类研究的,社交网络的兴起使得这些基于单一特征的聚类算法不能满足人们日益增长的需求,存在聚类效果不理想,对实际问题建模不准确等问题。因此,挖掘图数据的知识和信息有着重要的研究价值和实际意义。本文以现有图聚类算法对数据对象建模考虑单一为切入点,提出多层属性融合模型。通过对数据建模,将数据的自身属性特征和数据之间的关系建模为不同层次特征,设置不同的层权重系数,最后经过模型融合策略,将数据自身属性特征和相互关系统一融合到一个底层网络中。通过分析,该模型融合方法能更加反映实际中的数据之间的相互关系。本文针对现有聚类算法对图结构数据聚类效果不理想的问题,提出一种基于多层属性融合的自适应权重分配(Multi-layer Attribute Fusion for the Adaptive Weight Distribution,MAFAWD)图聚类算法。算法首先建立数据对象的图结构模型,划分不同属性层和结构层,通过设置不同的属性层和结构层权重系数,使建模后的数据更能反映实际分布。然后采用仿射传播聚类算法对图数据进行聚类。为了达到理想聚类效果,最后根据节点投票机制,自适应更改属性层权重系数值,使得最后聚类结果中同一簇内各节点之间联系紧密并且具有相同属性,不同簇间连接稀疏且节点属性不同。最后,本文在真实数据集DBLP上验证MAFAWD图聚类算法。通过实验仿真设计和对聚类结果的对比评估,表明本文提出的MAFAWD图聚类算法具有良好的聚类效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分