基于共享邻近度和概率分配的密度峰值聚类算法
作者机构:江西师范大学数学与统计学院
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:密度峰值聚类 K近邻 共享邻近度 概率分配 证据理论
摘 要:针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题。为此,本文提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。首先,基于K近邻和共享K近邻定义了样本点间的共享邻近度,再使用共享邻近度重新定义了样本点的局部密度,从而找到正确的类簇中心;然后,利用样本点的K近邻信息,提出传递概率分配策略和证据概率分配策略共同优化剩余样本点的分配,从而避免分配连带错误;最后,在17个合成数据集和12个UCI数据集上进行实验,将SP-DPC算法与DPC算法、SKM-DPC算法、DPC-NN算法、DBSCAN算法、K-means算法进行对比,实验结果表明SP-DPC算法在AMI、ARI、FMI这3个评价指标上整体上取得了相对最优值,聚类效果优于其他对比算法。