面向图像识别的深度学习VLIW处理器设计
Design of Deep Learning VLIW Processor for Image Recognition作者机构:西北工业大学计算机学院陕西西安710072 北京微电子技术研究所设计四部北京100076 西安职业技术学院动漫软件学院陕西西安710077
出 版 物:《西北工业大学学报》 (Journal of Northwestern Polytechnical University)
年 卷 期:2020年第38卷第1期
页 面:216-224页
核心收录:
学科分类:0810[工学-信息与通信工程] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:图像识别 深度学习 卷积神经网络 超长指令字(VLIW) 处理器 可扩展
摘 要:为了适应航空航天领域高分辨率图像识别和本地化高效处理的需求,解决现有研究中计算并行性不足的问题,在对深度卷积神经网络模型各层计算优化的基础上,设计了一款可扩展的多处理器簇的深度学习超长指令字(VLIW)处理器体系结构。设计中采用了特征图和神经元的并行处理,基于VLIW的指令级并行,多处理器簇的数据级并行以及流水线技术。FPGA原型系统测试结果表明,该处理器可有效完成图像分类和目标检测应用;当工作频率为200 MHz时,处理器的峰值性能可以达到128 GOP/s;针对选取的测试基准,该处理器的计算速度至少是CPU的12倍,是GPU的7倍;对比软件框架运行结果,处理器的测试精度的平均误差不超过1%。