二阶K近邻和多簇合并的密度峰值聚类算法
Density peaks clustering with second-order K-nearest neighbors and multi-cluster merging作者机构:南昌工程学院信息工程学院南昌330099 南昌工程学院南昌市智慧城市物联感知与协同计算重点实验室南昌330099
出 版 物:《吉林大学学报(工学版)》 (Journal of Jilin University:Engineering and Technology Edition)
年 卷 期:2024年第54卷第5期
页 面:1417-1425页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(62066030 61962036)
主 题:密度峰值聚类 流形数据 二阶K近邻 K近邻 吸引度 多簇合并策略
摘 要:针对流形数据中密度峰值聚类(DPC)算法的局部密度易找到错误的类簇中心,且分配策略易导致远离类簇中心的剩余样本被错误分配的问题,本文提出二阶K近邻和多簇合并的密度峰值聚类(DPC-SKMM)算法。首先,利用最小二阶K近邻定义局部密度,凸显类簇中心与非类簇中心间的密度差异,从而找到正确的类簇中心;其次,利用K近邻找出样本局部代表点并依此确定核心点,用核心点指导微簇划分;最后,利用最小二阶K近邻及共享近邻定义的微簇间吸引度合并微簇,避免远离类簇中心的样本被错误分配,且微簇合并过程无须迭代。本文将DPC-SKMM算法与IDPC-FA、DPCSA、FNDPC、FKNN-DPC、DPC算法进行对比,实验结果表明,DPC-SKMM算法能有效聚类流形及UCI数据集。