咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >优化目标检测网络的设计与FPGA硬件实现 收藏

优化目标检测网络的设计与FPGA硬件实现

Optimized object detection network design and FPGA hardware implementation

作     者:谢锋 杨昶楠 陆军 XIE Feng;YANG Changnan;LU Jun

作者机构:广西大学计算机与电子信息学院广西南宁530004 南宁职业技术学院党委宣传部广西南宁530008 

出 版 物:《广西大学学报(自然科学版)》 (Journal of Guangxi University(Natural Science Edition))

年 卷 期:2024年第49卷第3期

页      面:595-605页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:广西创新驱动重大专项(2020AA24002AA) 

主  题:目标检测 现场可编程门阵列加速 卷积算子优化 剪枝 量化 特制加速器 

摘      要:针对目标检测算法受限于越来越严苛的硬件算力与存储,导致在小型化设备上的部署存在巨大困难,本文提出一种基于现场可编程门阵列(FPGA)的深度学习模型专用加速器方案来实现目标检测的边缘部署。通过优化原始模型的卷积算子并进行剪枝和量化,使参数量减少52%。移植在MLK-F20-CM02-3EG开发板上的实验表明,特制化的加速器理论算力峰值达到407 GOPS,实际算力达328 GOPS,数字信号处理器(DSP)使用率为64%,在边缘设备上的功耗相比图形处理器大型平台降低了98%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分