基于邻域密度的K-means初始聚类中心优选方法
An Optimization Method for Initial Clustering Centers of K-means Based on Neighborhood Density作者机构:河北农业大学信息科学与技术学院河北保定071000 河北农业大学教务处河北保定071000
出 版 物:《重庆理工大学学报(自然科学)》 (Journal of Chongqing University of Technology:Natural Science)
年 卷 期:2021年第35卷第10期
页 面:180-186页
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
基 金:河北省高等教育教学改革研究与实践项目(2018GJJG140)。
主 题:多维网格 网格邻域 K-means算法 最大最小距离
摘 要:传统K-means算法初始聚类中心的选择具有随机性且对离群点敏感,导致聚类结果不稳定、准确率低等问题。针对上述问题,提出基于邻域密度的NDK-means算法。首先,通过多维网格划分得到样本的网格分布特性;然后,通过定义网格密度和网格邻域密度,确定多个局部高密度网格,同时引入迭代因子合并相邻高密度网格中心得到初始聚类中心候选集;最后,结合网格密度和距离,利用最大最小距离算法得到K个初始聚类中心。在UCI数据集上进行实验,实验结果表明:相对于其他局部邻域算法,新算法提高了聚类结果的准确率,具有较好的稳定性。