基于非负矩阵分解的多视角函数型聚类算法研究与应用
作者单位:兰州财经大学
学位级别:硕士
导师姓名:高海燕
授予年度:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 070104[理学-应用数学] 0701[理学-数学]
主 题:函数型聚类 非负矩阵分解 多视角学习 鲁棒性 双正交
摘 要:随着数据采集技术的进步,出现了具备无穷维和连续特征的函数型数据,由此展开了对函数型数据分析方法的探索,其中对函数型数据聚类分析方法的研究受到了广泛的关注。现有的多元函数型聚类方法大多采用先“融合各一元函数型数据再进行聚类的策略,其难以挖掘各变量间的深层次信息,而机器学习领域中的多视角学习却有着出色的聚合性能,其聚类分析结果也更为全面。此外,非负矩阵分解由于其较强的可解释性及简单的模型求解方法,在聚类研究领域得到广泛应用。一些学者将多视角学习与非负矩阵分解结合起来,展开聚类研究。受此启发,本文在函数型数据分析的框架下,基于非负矩阵分解,将多视角学习与函数型聚类相结合,提出两种多视角函数型聚类算法,希望能够通过这两种算法有效地揭示函数型数据的内在结构和特征,为相关领域的研究带来新的启发与思考。文章的具体研究内容如下: (1)针对包含噪声和异常值的函数型数据,构建基于图正则化非负矩阵分解的鲁棒多视角函数型聚类算法。该算法利用l范数,引入图正则化项,保持低秩数据矩阵的内在几何结构,提高算法性能。采用交替迭代方法对目标函数进行优化,给出模型的迭代更新求解算法及算法流程,证明了算法的收敛性并对其计算复杂度进行了探讨。在随机模拟数据集和Growth数据集上进行实验,表明该方法在提高聚类性能的同时具有鲁棒性。将其应用于对北京市空气质量监测站点的空间布局识别,结果表明该方法具有一定的现实意义。 (2)针对函数型数据高维且体量大的特点,构建鲁棒双正交多视角函数型聚类算法。采用范数,引入图正则化,考虑数据的局部几何特征,集成多视角异构特征;同时对矩阵添加约束,利用表示矩阵和基矩阵的正交性提高算法的聚类性能。采用交替迭代方法对模型优化,给出算法流程,利用辅助函数法证明算法的收敛性。在随机模拟数据集、Growth数据集以及TIMIT语音数据集上的实验表明,该方法能够有效提高聚类性能。同时,针对甘肃省行政区划气象数据的实际应用表明该方法具有良好的适用性。