咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >不确定数据信任密度峰值聚类算法 收藏

不确定数据信任密度峰值聚类算法

Belief Density Peak Clustering Algorithm for Uncertain Data

作     者:汪康 马宗方 田鸿朋 宋琳 WANG Kang;MA Zongfang;TIAN Hongpeng;SONG Lin

作者机构:西安建筑科技大学信息与控制工程学院陕西西安710055 

出 版 物:《信息与控制》 (Information and Control)

年 卷 期:2022年第51卷第3期

页      面:349-360页

核心收录:

学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家重点研发计划(2019YFC1907105) 陕西省重点研发计划(2020GY-186,2020SF-367) 

主  题:聚类 密度峰值 K近邻 证据推理 信任划分 

摘      要:密度峰值聚类算法具有简单高效、无需迭代计算和提前设定类簇数的优势,但是在划分非类中心样本时容易产生“多米诺骨牌效应,并且不能准确划分重叠区域的样本和噪声。为了解决以上问题,提出了不确定数据信任密度峰值聚类算法。首先,该算法在密度峰值聚类算法获取类中心样本的基础上,利用非类中心样本的K近邻求出样本属于不同类的信任值,将样本划分到信任值最大的类别,得到基于K近邻的初步聚类结果。然后,计算关于密度的上分位数得到密度阈值,在证据推理框架下进行信任划分,将密度小于该阈值的孤立样本划分到噪声类;处于重叠部分的样本划分到相关单类组成的复合类;信任值强烈支持属于某个类别的样本划分到相应的单类。该算法通过引入复合类和噪声类能够更加准确地展现样本在现有属性信息下的不确定性。实验结果表明,该算法在人工数据集和UCI数据集上相比于其他对比算法,能够取得更好的聚类性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分