基于NEON并行计算架构的矩阵乘法加速技术
Matrix Multiplication Acceleration Based on NEON Parallel Computing Architecture作者机构:航空工业西安航空计算技术研究所陕西西安710000
出 版 物:《航空计算技术》 (Aeronautical Computing Technique)
年 卷 期:2024年第54卷第3期
页 面:48-52页
学科分类:08[工学] 0825[工学-航空宇航科学与技术]
基 金:航空科学基金项目资助(2022Z071031001)
主 题:通用信号处理 ARMv8 FT-2000/4 NEON 矩阵乘法
摘 要:当今计算机的信号处理需求与日俱增。随着ARM体系结构的迅速发展,基于ARM架构的国产处理器迅速崛起,研究针对ARM平台的通用信号处理加速技术具有重要意义。通过分析ARMv8架构以及NEON并行计算技术,以FT-2000/4(ARMv8架构)为实验平台,研究典型DSP函数库在ARMv8架构上的优化加速。以矩阵运算为例,提出了基于NEON的通用矩阵乘法算法。实验结果表明所提算法在ARM架构上有显著的加速效果。为搭建针对ARM架构的全面且高效的通用信号处理库提供了技术支持。