面向GPU的稀疏对角矩阵自适应SpMV优化方法
作者机构:哈尔滨工程大学计算机学院 电子政务建模仿真国家工程实验室
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2024年
学科分类:07[理学] 08[工学] 070102[理学-计算数学] 081201[工学-计算机系统结构] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:SpMV 稀疏对角矩阵 GPU 自适应优化方法 矩阵结构特征
摘 要:稀疏矩阵向量乘(SpMV)是稀疏线性系统的计算核心和瓶颈,其运算效率会影响迭代求解器的整体性能,其优化研究一直是科学计算和工程应用领域中的研究热点之一。偏微分方程的离散化会产生稀疏对角矩阵,由于其多样的非零元分布,导致没有一种方法能够在所有矩阵中取得最优时间性能。针对上述问题,提出了一种面向GPU的稀疏对角矩阵自适应SpMV优化方法AST(Adaptive SpMV Tuning),该方法通过设计特征空间,构建特征提取器,提取矩阵结构精细特征,通过深入分析特征和SpMV方法的相关性。建立可扩展的候选方法集合,形成特征和最优方法的映射关系,构建性能预测工具,实现矩阵最优方法的高效预测。实验结果表明,AST能够取得85.8%的预测准确率,平均时间性能损失为最优方法的0.09倍。相比于DIA、HDIA、HDC、DIA-Adaptive和DRM,能够获得平均20.19、1.86、3.06、3.72和1.53倍的内核运行时间加速和1.05、1.28、12.45、1.94和0.97倍的浮点运算性能加速。