基于自然和加权共享最近邻的密度峰值聚类算法
作者机构:华东交通大学理学院
出 版 物:《华东交通大学学报》 (Journal of East China Jiaotong University)
年 卷 期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:聚类算法 密度峰值聚类 自然最近邻 共享最近邻 簇中心扩散
摘 要:密度峰值聚类(DPC)作为一种高效且不需要迭代的聚类算法得到广泛应用。研究发现,该算法使用在非球形簇和密度不均匀的聚类时,DPC很难选择正确的簇中心,且该算法受截断距离参数的影响较大。【目的】为了解决DPC算法在密度分布不均匀的数据集上效果不佳的问题,【方法】提出了一种基于自然和加权共享最近邻的密度峰值聚类算法。该算法首先引入自然最近邻计算加权值,再根据一阶和二阶共享最近邻的定义重新计算数据对象之间的相似度,然后通过融合共享最近邻相似度的定义和自然最近邻权重值计算相对密度和相对距离,最后还设计了新的分类型簇中心扩散分配策略。【结果】在8个不同类型的数据集上的实验结果表明,本文所提出算法的聚类性能要明显优于其余4个对比算法。【结论】该方法在密度不均匀的数据集上对簇中心也有较好的识别效果,很好地解决了上述问题。