咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于硬件属性的OpenCL参数自动优化研究 收藏
基于硬件属性的OpenCL参数自动优化研究

基于硬件属性的OpenCL参数自动优化研究

作     者:李嘉鹏 

作者单位:西安电子科技大学 

学位级别:硕士

导师姓名:田玉敏;张文琪

授予年度:2022年

学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论] 

主      题:异构计算 OpenCL 自动调参 微基准程序 硬件参数 

摘      要:OpenCL凭借其开放性和代码可移植性成为异构并行计算中热门的并行编程框架。OpenCL程序不具备良好的性能可移植性,当OpenCL程序跨平台移植时需要重新对其进行参数优化,该过程耗时耗力,故OpenCL程序的参数自动优化一直是研究重点。在OpenCL程序参数自动优化中,存在调优参数选择不合适而无法有效发挥设备性能的情况。在搜索空间的选择上通常会选择较大的搜索空间以保证对多种设备的兼容性,该方式会导致自动调优效率低下。而借助经验来进行搜索空间优化,则无法保证对陌生设备的调优效果。在搜索过程中,存在着执行失败的情况,会产生额外的时间花销。针对以上问题,本文提出一种OpenCL程序参数自动调优框架,有效利用设备硬件属性对参数自动优化过程进行优化。本文主要对调优参数确定、搜索空间生成、搜索过程优化进行研究,本文主要工作如下:(1)总结OpenCL内核优化方式并对基准算法的OpenCL内核进行优化,在传统调优参数基础上加入新的调优参数,提高对OpenCL程序执行过程的细粒化控制。对非2的n次方规模问题调优参数取值范围进行优化。总结调优参数取值范围并确定通用搜索空间,确保通过调整参数能够有效发挥设备性能。(2)提出一种自动生成精简搜索空间的方法。该方法借助硬件属性从计算单元负载、调度批利用率、调度并行度等角度对通用搜索空间进行过滤,获得精简搜索空间。本文提出并设计微基准程序来提取设备硬件属性。该方法有效的减小了搜索空间的规模,减少了搜索过程的时间花销。(3)提出了一种基于资源消耗分析的搜索过程优化方法,该方法能够有效减少搜索过程执行失败的情况。同时引入萤火虫算法和模拟退火算法加速搜索过程。(4)基于上述研究,设计了一种新的OpenCL参数自动调优框架。该框架具有良好的易用性,将复杂的OpenCL实现过程和搜索空间优化过程对用户隐藏并提供简单的接口用于参数自动优化。该框架通过迭代参数配置来进行参数优化。本文通过实验验证了参数自动调优框架调优精度和调优速度。实验结果表明,优化后的OpenCL内核在目标设备上性能提高至少20%。精简搜索空间对于最优参数配置和近似最优配置覆盖率达到80%以上。对比其他主流调优框架,参数调优速度至少提高了28%。改善了非2规模计算问题搜索空间后,其性能在2500×2500问题规模下提高至少10%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分