面向密度峰值聚类的高效相似度度量
Efficient similarity measure for density peaks clustering作者机构:中国矿业大学计算机科学技术学院江苏徐州221116 徐州工业职业技术学院信息工程学院江苏徐州221114
出 版 物:《山东大学学报(工学版)》 (Journal of Shandong University(Engineering Science))
年 卷 期:2024年第54卷第3期
页 面:12-21,29页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(62206296) 中央高校基本科研业务费专项资金资助项目(2022QN1095) 江苏省高等职业院校专业带头人高端研修资助项目(2022GRFX063)
主 题:密度峰值聚类 聚类中心 相似度矩阵 计算复杂度 大规模数据集
摘 要:针对密度峰值聚类(density peaks clustering,DPC)计算复杂度高的问题,提出一种面向密度峰值聚类的高效相似度度量(efficient similarity measure,ESM)法,通过仅度量最近邻之间的相似度构建不完全相似度矩阵。最近邻的选择基于一个随机第三方数据对象,无需另外引入参数。基于ESM法构建相似度矩阵,提出一种改进的高效密度峰值聚类(efficient density peaks clustering,EDPC)算法,在保持准确率的同时提高DPC识别聚类中心的效率。理论分析和试验结果表明,ESM法通过减少一定不相似的相似度,可以有效提高DPC及其改进算法基于K最近邻的密度峰值聚类(density peaks clustering based on K-nearest neighbors,DPC-KNN)和模糊加权K最近邻密度峰值聚类(fuzzy weighted K-nearest neighbors density peaks clustering,FKNN-DPC)的计算效率,具有较强的可扩展性。