基于CUDA的大规模稀疏矩阵的PCG算法优化
CUDA-based PCG algorithm optimization for a large sparse matrix作者机构:清华大学水沙科学与水利水电工程国家重点实验室北京100084
出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))
年 卷 期:2014年第54卷第8期
页 面:1006-1012页
核心收录:
学科分类:0810[工学-信息与通信工程] 07[理学] 08[工学] 0815[工学-水利工程] 0805[工学-材料科学与工程(可授工学、理学学位)] 081503[工学-水工结构工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"八六三"高技术项目(2012AA06A112) 国家自然科学基金重点资助项目(51239006) 水沙科学与水利水电工程国家重点实验室基金项目(2012-KY-02)
主 题:预处理共轭梯度(preconditioned conjugate gradient,PCG)算法 CUDA(compute unified device architecture)技术 稀疏矩阵 并行计算 优化
摘 要:为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。