咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于密度的聚类算法研究 收藏
基于密度的聚类算法研究

基于密度的聚类算法研究

作     者:陈朝威 

作者单位:北京交通大学 

学位级别:硕士

导师姓名:常冬霞

授予年度:2019年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:聚类算法 密度差分 合并准则 神经网络 密度有序图 

摘      要:聚类作为一种无监督学习方法已经在模式识别、人工智能、数据分析、图像处理及生物医学等领域中得到了广泛的应用。当前,根据不同的准则已经提出了众多的聚类算法,这些算法虽然能够针对特定数据集实现对数据的划分,但在复杂多样的应用场景下,仍然存在着不少问题。其中预先指定类别数、算法参数的敏感性、对任意形状和不同密度的数据集以及高维数据集聚类性能不理想是现有聚类算法存在的主要问题。针对这些问题,本文主要对基于密度的聚类算法展开了研究,主要成果如下:(1)为了有效处理带有噪声的数据,本文提出一种基于密度差分的聚类算法实现了对带有噪声数据的自动聚类。所提算法首先根据噪声数据和有用数据密度的不同,采用基于密度差分的方式实现了对噪声和有用数据的分类。接着通过构建数据间的邻域,进一步实现了对有用数据间不同类别的划分。最后,通过仿真实验验证了所提算法的有效性。(2)针对存在不同密度的数据聚类问题,本文提出了一种基于区域分割的自动聚类算法。首先提出了一种新的基于反向近邻的密度定义,有效地检测出区域内密集点和稀疏点,从而将数据集划分为多个子区域。接着通过合并准则自动地将相关区域进行合并,进而获得数据集的最终聚类结果。该算法不需要预先设定类别数并且没有阈值的限制。最后,通过实验验证了所提算法的有效性。(3)为了解决对高维数据集的聚类问题,本文提出了一种结合神经网络和密度有序图的深度聚类算法。首先,预训练自编码网络,然后基于编码特征构建一个基于密度的有序图。算法所使用损失函数由自编码网络的重建损失和密度有序图的损失两部分构成,并通过梯度下降算法优化网络参数。最后,通过实验将所提算法与已有相关算法进行对比,验证了算法的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分