异构并行计算下高维混合型数据聚类算法研究
Research on high⁃dimensional mixed data clustering algorithm under heterogeneous parallel computing作者机构:内蒙古农业大学计算机技术与信息管理系内蒙古包头014109
出 版 物:《现代电子技术》 (Modern Electronics Technique)
年 卷 期:2024年第47卷第9期
页 面:139-142页
学科分类:0810[工学-信息与通信工程] 08[工学] 081001[工学-通信与信息系统] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:内蒙古哲学社会科学规划项目:基于大数据的内蒙古旅游目的地形象感知研究(2020NDC067)
主 题:异构并行计算 高维混合型数据 K⁃Prototypes聚类算法 欧氏距离 统计序列特征 负载平衡
摘 要:高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特征优化。采用K⁃Prototypes聚类算法提取高维混合型数据的统计序列特征,评估数据与类中心的相异性,计算数据与类中心的欧氏距离,实现高维混合型数据聚类。采用异构并行计算技术进行高维混合型数据K⁃Prototypes聚类的并行化处理,合理分配CPU与GPU工作,达到CPU与GPU的工作负载平衡,提高K⁃Prototypes的聚类效率。实验结果表明,此算法对于高维混合型数据的聚类效果好、运行时间短、性能稳定。