结合度量融合和地标表示的自编码谱聚类算法
An autoencoder-based spectral clustering algorithm combined with metric fusion and landmark representation作者机构:江南大学物联网工程学院江苏无锡214122 江南大学物联网技术应用教育部工程研究中心江苏无锡214122
出 版 物:《智能系统学报》 (CAAI Transactions on Intelligent Systems)
年 卷 期:2020年第15卷第4期
页 面:687-696页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:大规模数据集 度量融合 地标表示 相对质量 稀疏表示 栈式自编码器 联合学习 嵌入表示
摘 要:针对大多数现有谱聚类算法处理大规模数据集时面临聚类精度低、大规模相似度矩阵存储开销大的问题,提出一种结合度量融合和地标表示的自编码谱聚类算法。引入相对质量概念进行节点评估,选取最具代表性的点作为地标点,通过稀疏表示近似获得图相似度矩阵,以降低存储开销。同时考虑到近邻样本的几何分布和拓扑分布的信息,融合欧氏距离与Kendall Tau距离来度量地标点与其他样本之间的相似度,提高聚类精度;以栈式自编码器取代拉普拉斯矩阵特征分解,将所获得的相似度矩阵作为自编码器的输入,通过联合学习嵌入表示和聚类来进一步提高聚类精度。在5个大规模数据集上的实验验证了本文算法的有效性。