基于GPU的稀疏矩阵存储格式优化研究
Research on Storage Format Optimization of Sparse Matrix Based on GPU作者机构:南京邮电大学计算机学院南京210023 南京邮电大学自动化学院南京210023
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2019年第45卷第9期
页 面:23-31,39页
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
基 金:国家自然科学基金(61672298 61873326 61373136)
主 题:稀疏矩阵向量乘 计算统一设备架构 图形处理器 存储格式 浮点运算
摘 要:稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提高SpMV在GPU平台上的并行性,并设计基于快速分段求和算法的GPU内核函数,保证计算结果的确定性及其在不同GPU平台上的再现性。实验结果表明,BRCP存储格式具有较高的计算效率,相比BRC存储格式可减少并行环境中的SpMV计算误差,并提高PageRank排序的准确率。