融合局部截断距离及小簇合并的密度峰值聚类
作者机构:安庆师范大学数理学院 安徽省大别山区域复杂生态系统建模仿真与控制重点实验室
出 版 物:《山东大学学报(工学版)》 (Journal of Shandong University(Engineering Science))
年 卷 期:2024年
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:国家自然科学基金青年资助项目(61702012) 安徽省自然科学基金面上资助项目(2008085MF193) 安徽省高等学校自然科学研究重点资助项目(2022AH051053)
摘 要:针对密度峰值聚类算法定义的截断距离仅考虑样本全局分布,在样本分配时容易产生“多米诺骨牌现象等问题,提出一种融合局部截断距离及小簇合并的密度峰值聚类算法。基于样本局部分布信息计算每个样本截断距离和局部密度,有利于准确获得复杂结构数据集上密度峰;根据样本决策值之间差值关系选择潜在密度峰并形成多个小簇;定义一种新的小簇间相似度,根据此相似度将小簇合并获得聚类结果,有效避免了“多米诺骨牌现象。采用6个人工数据集和8个UCI数据集进行验证,所提算法在上述14个数据集上的标准化互信息、调整兰德系数和调整互信息平均值比5个对比算法平均提升18.15%、28.99%和20.22%,比原始密度峰值聚类算法提升30.06%,47.15%和31.90%,具有较好的聚类效果。