基于img2col的2D卷积算子在DCU加速器上的并行优化研究
作者机构:青岛大学计算机科学技术学院
出 版 物:《青岛大学学报(自然科学版)》 (Journal of Qingdao University(Natural Science Edition))
年 卷 期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:山东省自然科学基金面上项目(批准号:ZR201910310143)资助
摘 要:深度学习中,因卷积运算巨大的计算需求,经常成为限制大型卷积神经网络性能的瓶颈,为此,提出使用并行技术来优化卷积运算的策略。首先,对传统2D卷积算子进行重构,使其转换为通用矩阵乘法;其次,使用共享内存和数据预取等技术,降低访存次数;最后,针对加速器的硬件架构,调整算法的并行方案来进一步提高计算性能。实验结果表明,相较传统的实现方式,该方法将运算速度提升了近7.5倍,使用该优化策略提高了卷积运算效率,有望为大型卷积神经网络的加速提供有效的支持。