咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于CUDA的大规模稀疏矩阵的PCG算法优化 收藏

基于CUDA的大规模稀疏矩阵的PCG算法优化

CUDA-based PCG algorithm optimization for a large sparse matrix

作     者:郑经纬 安雪晖 黄绵松 ZHENG Jingwei;AN Xuehui;HUANG Miansong

作者机构:清华大学水沙科学与水利水电工程国家重点实验室北京100084 

出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))

年 卷 期:2014年第54卷第8期

页      面:1006-1012页

核心收录:

学科分类:0810[工学-信息与通信工程] 07[理学] 08[工学] 0815[工学-水利工程] 0805[工学-材料科学与工程(可授工学、理学学位)] 081503[工学-水工结构工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家"八六三"高技术项目(2012AA06A112) 国家自然科学基金重点资助项目(51239006) 水沙科学与水利水电工程国家重点实验室基金项目(2012-KY-02) 

主  题:预处理共轭梯度(preconditioned conjugate gradient,PCG)算法 CUDA(compute unified device architecture)技术 稀疏矩阵 并行计算 优化 

摘      要:为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分