基于引力相似度和相对密度的不确定数据流聚类
Uncertain Data Stream Clustering Algorithm Based on Gravity Similarity and Relative Density Techniques作者机构:浙江工业大学计算机科学与技术学院杭州310023 浙江科技学院信息与电子工程学院杭州310023
出 版 物:《上海交通大学学报》 (Journal of Shanghai Jiaotong University)
年 卷 期:2016年第50卷第6期
页 面:873-878页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:水利部公益性行业科研专项项目(201401044)资助
摘 要:针对不确定数据流聚类问题,提出一种基于引力相似度和相对密度的聚类算法.采用在线/离线两阶段处理框架,综合考虑元组之间的相似度与元组自身的不确定性,利用引力相似度为每个不断到达的数据元组寻找可能归属的微簇,以新的离群点处理和在线维护机制来适应数据流的演化情况,并在离线层使用相对密度算法进行聚类,不需要预先指定聚类数且可处理任意形状的微簇.实验结果表明,与现有的聚类方法相比,所提出的算法具有更高的聚类质量和准确度.