BIRCH聚类算法优化及并行化研究
Research of BIRCH clustering algorithm optimization and parallelism作者机构:韩山师范学院数学与信息技术学院广东潮州521041
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2007年第28卷第18期
页 面:4345-4346,4369页
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:为了提高聚类质量,针对BIRCH算法中在聚类精度方面所存在的不足,提出了聚类特征树中的不同簇应使用不同阀值的思想,较好地改善了对体积相差悬殊的簇不能很好聚类的问题。并且深入地研究和分析了如何在集群系统中进行快速聚类,提出了自定义数据类型、采用数据并行思想和非均匀数据划分策略等几点改进意见。最后实验结果表明,通过改进能够获得比较理想的运行时间和加速比性能。