咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于NEON并行计算架构的矩阵乘法加速技术 收藏

基于NEON并行计算架构的矩阵乘法加速技术

Matrix Multiplication Acceleration Based on NEON Parallel Computing Architecture

作     者:祁俊雄 程岳 刘作龙 韩伟 潘妍 李晨卉 QI Jun-xiong;CHENG Yue;LIU Zuo-long;HAN Wei;PAN Yan;LI Chen-hui

作者机构:航空工业西安航空计算技术研究所陕西西安710000 

出 版 物:《航空计算技术》 (Aeronautical Computing Technique)

年 卷 期:2024年第54卷第3期

页      面:48-52页

学科分类:08[工学] 0825[工学-航空宇航科学与技术] 

基  金:航空科学基金项目资助(2022Z071031001) 

主  题:通用信号处理 ARMv8 FT-2000/4 NEON 矩阵乘法 

摘      要:当今计算机的信号处理需求与日俱增。随着ARM体系结构的迅速发展,基于ARM架构的国产处理器迅速崛起,研究针对ARM平台的通用信号处理加速技术具有重要意义。通过分析ARMv8架构以及NEON并行计算技术,以FT-2000/4(ARMv8架构)为实验平台,研究典型DSP函数库在ARMv8架构上的优化加速。以矩阵运算为例,提出了基于NEON的通用矩阵乘法算法。实验结果表明所提算法在ARM架构上有显著的加速效果。为搭建针对ARM架构的全面且高效的通用信号处理库提供了技术支持。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分