一种基于层次距离计算的聚类算法
A Hierarchy Distance Computing Based Clustering Algorithm作者机构:北京大学信息科学技术学院北京100871 四川大学计算机学院成都610065 成都市公安局科技处成都610017
出 版 物:《计算机学报》 (Chinese Journal of Computers)
年 卷 期:2007年第30卷第5期
页 面:786-795页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(60473071 60473051 60503037) 中国博士后科学基金(20060400002) 四川省青年科技基金(07ZQ026-055) 国家"八六三"高技术研究发展计划项目基金(2006AA01Z230) 北京市自然科学基金(4062018)资助
摘 要:针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果.