咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于边界点检测的变密度聚类算法 收藏

基于边界点检测的变密度聚类算法

Varied density clustering algorithm based on border point detection

作     者:陈延伟 赵兴旺 CHEN Yanwei;ZHAO Xingwang

作者机构:山西大学计算机与信息技术学院太原030006 计算智能与中文信息处理教育部重点实验室(山西大学)太原030006 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2022年第42卷第8期

页      面:2450-2460页

学科分类:08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 

基  金:国家自然科学基金资助项目(62072293)。 

主  题:密度聚类 相对密度 变密度 边界点检测 噪声识别 

摘      要:密度聚类算法因具有对噪声鲁棒、能够发现任意形状的类等优点,得到了广泛的应用。然而,在实际应用中,这种算法面临着由于数据集中不同类的密度分布不均,且类与类之间的边界难以区分等导致聚类效果较差的问题。为解决以上问题,提出一种基于边界点检测的变密度聚类算法(VDCBD)。首先,基于给出的相对密度度量方法识别变密度类之间的边界点,以此增强相邻类的可分性;其次,对非边界区域的点进行聚类以找到数据集的核心类结构;接着,依据高密度近邻分配原则将检测到的边界点分配到相应的核心类结构中;最后,基于类结构信息识别数据集中的噪声点。在人造数据集和UCI数据集上与K-means、基于密度的噪声应用空间聚类(DBSCAN)算法、密度峰值聚类算法(DPCA)、有效识别密度主干的聚类(CLUB)算法、边界剥离聚类(BP)算法进行了比较分析。实验结果表明,所提算法可以有效解决类分布密度不均、边界难以区分的问题,并在调整兰德指数(ARI)、标准化互信息(NMI)、F度量(FM)、准确度(ACC)评价指标上优于已有算法;在运行效率分析中,当数据规模较大时,VDCBD运行效率高于DPCA、CLUB和BP算法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分