基于开源RISC-Ⅴ内核的卷积神经网络加速系统设计-南通市图书馆

文献详情 >基于开源RISC-Ⅴ内核的卷积神经网络加速系统设计收藏

基于开源RISC-Ⅴ内核的卷积神经网络加速系统设计

作者单位：东南大学

学位级别：硕士

授予年度：2021年

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：卷积神经网络硬件加速器 RISC-Ⅴ处理器片上系统

摘要：近些年,卷积神经网络已经被广泛地应用到图像识别、语音识别等领域。但是卷积神经网络算法具备计算密集和存储密集两大特性,使得传统的移动终端设备在部署算法时计算实时性和功耗等方面无法满足特定要求。同时在移动终端设备中,处理器的设计成本占总成本的比例往往较高。因此,研究以开源处理器为核心、具备卷积神经网络硬件加速器的片上系统有着重要的实用意义。本文首先详细地分析了卷积神经网络算法的运算过程及其计算并行性特点,针对不同神经网络模型之间的差异,设计了运算参数可配置的神经网络硬件加速器。加速器内部具有多个并行化的卷积运算单元和数据缓存单元,可以对输入通道以及输出通道的计算进行并行化展开,输入加速器的计算数据均采用量化精度为8bit的定点数进行表示。加速器内部还支持Re LU和Sigmoid两种激活方式,以及最大池化和平均池化两种池化方式。在所设计的硬件加速器基础上,以开源RISC-Ⅴ处理器RI5CY为核心,通过AXI4总线构建了具有卷积神经网络硬件加速器的加速系统,并设计了相关系统启动、硬件驱动层和应用接口层软件,用于支持算法模型部署。在Xilinx公司的XC7Z100 FPGA平台中利用经典的VGG16网络模型对系统进行测试,系统工作频率为150MHz,硬件加速器的计算吞吐率峰值为129.6GOPS,功耗约为4.8W,能效比为27.1GOPS/W。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于开源RISC-Ⅴ内核的卷积神经网络加速系统设计

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于开源RISC-Ⅴ内核的卷积神经网络加速系统设计

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：