咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于img2col的2D卷积算子在DCU加速器上的并行优化研... 收藏

基于img2col的2D卷积算子在DCU加速器上的并行优化研究

作     者:周全 李强 陶顺安 韩兆冰 卢璐 

作者机构:青岛大学计算机科学技术学院 

出 版 物:《青岛大学学报(自然科学版)》 (Journal of Qingdao University(Natural Science Edition))

年 卷 期:2024年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:山东省自然科学基金面上项目(批准号:ZR201910310143)资助 

主  题:卷积算子 GEMM 并行计算 优化 

摘      要:深度学习中,因卷积运算巨大的计算需求,经常成为限制大型卷积神经网络性能的瓶颈,为此,提出使用并行技术来优化卷积运算的策略。首先,对传统2D卷积算子进行重构,使其转换为通用矩阵乘法;其次,使用共享内存和数据预取等技术,降低访存次数;最后,针对加速器的硬件架构,调整算法的并行方案来进一步提高计算性能。实验结果表明,相较传统的实现方式,该方法将运算速度提升了近7.5倍,使用该优化策略提高了卷积运算效率,有望为大型卷积神经网络的加速提供有效的支持。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分