咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Caffe的嵌入式多核处理器深度学习框架并行实现 收藏

基于Caffe的嵌入式多核处理器深度学习框架并行实现

A Deep Learning Frame on Embedded Multicore Processors Based on Caffe and Its Parallel Implementation

作     者:高榕 张良 梅魁志 GAO Rong;ZHANG Liang;MEI Kuizhi

作者机构:西安交通大学电子与信息工程学院西安710049 

出 版 物:《西安交通大学学报》 (Journal of Xi'an Jiaotong University)

年 卷 期:2018年第52卷第6期

页      面:36-41,113页

核心收录:

学科分类:0810[工学-信息与通信工程] 08[工学] 081104[工学-模式识别与智能系统] 0805[工学-材料科学与工程(可授工学、理学学位)] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家重点研发计划资助项目(2017YFB1301100) 

主  题:深度学习 移动端 前向计算 并行 OpenCL 

摘      要:针对开源深度学习快速特征嵌入的卷积框架(Caffe)在Android移动端进行前向计算时存在的兼容性和时间性能差的问题,提出了基于Caffe的嵌入式同构、异构并行化改进设计方法。该方法将Caffe及其第三方库通过交叉编译移植到嵌入式移动平台后,利用同构的多核多线程方法分别对卷积层、输入帧之间的部分前向计算过程进行了并行化;实现了采用开放运算语言(OpenCL)的异构图形处理器(GPU)卷积计算,进一步提升了框架的处理速度。对3种经典的深度神经网络模型MNIST、Cifar-10和CaffeNet进行了测试对比,测试结果表明:在没有任何模型精度损失的条件下,并行后的前向计算耗时明显低于并行前,时间性能提升最高达到2倍。所提方法能够将深度学习框架Caffe高效地、并行地部署和应用于嵌入式移动多核芯片上。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分