咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合集群度与距离均衡优化的K-均值聚类算法 收藏

融合集群度与距离均衡优化的K-均值聚类算法

K-means clustering algorithm based on cluster degree and distance equilibrium optimization

作     者:王日宏 崔兴梅 WANG Rihong;CUI Xingmei

作者机构:青岛理工大学计算机工程学院山东青岛266033 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2018年第38卷第1期

页      面:104-109,115页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0811[工学-控制科学与工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目(61502262) 山东省研究生教育创新计划项目(SDYY16023)~~ 

主  题:初始聚类中心 K-均值算法 集群度 距离均衡优化 文本聚类 

摘      要:针对传统K-均值算法对初始聚类中心选择较为敏感的问题,提出了一种基于融合集群度与距离均衡优化选择的K-均值聚类(K-MCD)算法。首先,基于集群度思想选取初始簇中心;然后,遵循所有聚类中心距离总和均衡优化的选择策略,获得最终初始簇中心;最后,对文本集进行向量化处理,并根据优化算法重新选取文本簇中心及聚类效果评价标准进行文本聚类分析。对文本数据集从准确性与稳定性两方面进行仿真实验分析,与K-均值算法相比,K-MCD算法在4个文本集上的聚类精确度分别提高了18.6、17.5、24.3与24.6个百分点;在平均进化代数方差方面,K-MCD算法比K-均值算法降低了36.99个百分点。仿真结果表明K-MCD算法能有效提高文本聚类精确度,并具有较好的稳定性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分