基于距离阈值及样本加权的K-means聚类算法
K-means Clustering Algorithm Based on Distance Threshold and Weighted Sample作者机构:中国矿业大学计算机科学与技术学院江苏徐州221116 中国矿业大学科技园公共信息服务中心江苏徐州221116
出 版 物:《微电子学与计算机》 (Microelectronics & Computer)
年 卷 期:2015年第32卷第8期
页 面:135-138页
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
基 金:教育部高等学校博士学科点专项科研基金资助项目(20110095110010) 江苏省"333工程"科研项目(BRA2014047) 江苏省"六大人才高峰"科研项目(2014-WLW-023)
主 题:距离阈值 样本加权 K-means,轮廓系数
摘 要:提出了一种基于距离阈值及样本加权的K-means聚类算法.该算法首先采用样本集的样本均值作为第一个初始族中心;其次基于距离阈值的方法动态确定初始族中心及个数;最后基于样本加权的方法来降低离散点对聚类效果的影响,使带权值的样本点参与整个聚类过程,采用轮廓系数来衡量不同算法的聚类质量.实验结果表明:相比于原始的K-means聚类算法和文献[1]中算法,所提出的算法具有更好的聚类质量.