基于三阶张量的大规模数据谱聚类集成算法
Spectral clustering ensemble algorithm based on three-order tensor for large-scale data作者机构:济南大学信息科学与工程学院山东济南250024 山东省网络环境智能计算技术重点实验室山东济南250024
出 版 物:《大数据》 (Big Data Research)
年 卷 期:2024年第10卷第3期
页 面:133-148页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(No.62273164,No.61873324) 山东省自然科学基金项目(No.ZR2019MF040)
摘 要:为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图分割的方法得到初步聚类结果;最后,提出三阶张量集成方法,将多个聚类结果进行融合,得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证,相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法,该算法表现出更优异的性能。