申威众核处理器访存与通信融合编译优化
Memory Access and Communication Fusion Compiler Optimization for Sunway Many-core Processors作者机构:国家并行计算机工程技术研究中心北京100190
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2024年第35卷第6期
页 面:2648-2667页
核心收录:
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:先进计算与智能工程(国家级)实验室基金 国家重点研发计划重点专项(2021YFB0301100)
主 题:申威众核处理器 多级存储层次 RMA通信 并行语言 编译优化
摘 要:申威众核片上多级存储层次是缓解众核“访存墙的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻用户编程优化负担,提出一种多级存储层次访存与通信融合的编译优化方法.该方法首先设计融合编译指示,将程序高层信息传递给编译器.其次构建编译优化收益模型并设计启发式循环优化方案迭代求解框架,并由编译器完成循环优化方案的求解和优化代码的变换.通过编译生成的DMA和RMA批量数据传输操作,将较低存储层次空间中高访问延迟的核心数据批量缓冲进低访问延迟的更高存储层次空间中.在3个典型测试用例上进行优化实验测试与分析,结果表明所提出的优化在性能上与手工优化相当,较未优化版程序性能有显著提升.