文档聚类中k-means算法的一种改进算法
An Improved k-means Algorithm for Documents Clustering作者机构:北京大学计算机研究所文字信息处理技术国家重点实验室北京100871
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2003年第29卷第2期
页 面:102-103,157页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感。为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法。实验表明,该改进算法比原k-means算法具有更高的准确性和稳定性。