咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向国产异构DCU平台的大规模并行矩量法研究 收藏

面向国产异构DCU平台的大规模并行矩量法研究

Study of the parallel MoM on a domestic heterogeneous DCU platform

作     者:贾瑞鹏 林中朝 左胜 张玉 杨美红 JIA Ruipeng;LIN Zhongchao;ZUO Sheng;ZHANG Yu;YANG Meihong

作者机构:西安电子科技大学电子工程学院陕西西安710071 齐鲁工业大学计算机科学与技术学院山东济南250000 

出 版 物:《西安电子科技大学学报》 (Journal of Xidian University)

年 卷 期:2024年第51卷第2期

页      面:76-83页

核心收录:

学科分类:080904[工学-电磁场与微波技术] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 

基  金:陕西省重点研发计划(2023-ZDLGY-09,2022ZDLGY02-01,2021GXLH-02) 中央高校基本科研业务费专项资金(QTZX23018) 

主  题:高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算 

摘      要:面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分