咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向飞腾平台的图像增强算法并行优化研究 收藏
面向飞腾平台的图像增强算法并行优化研究

面向飞腾平台的图像增强算法并行优化研究

作     者:郭子涵 

作者单位:郑州大学 

学位级别:硕士

导师姓名:商建东

授予年度:2022年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:图像增强算法 FT-M7002 并行优化 访存优化 循环优化 

摘      要:随着视频结构化、计算摄像等数字处理技术的飞速发展,巨大的算力需求促使高性能数字信号处理器飞速发展,飞腾M7002作为一款国产高性能DSP应运而生,为了充分发挥该高性能平台硬件优势,面向国产DSP特定体系结构开发并优化相应的高性能图像处理算法,拓宽我国DSP芯片的应用方向,进而实现软硬件的高效结合是我们目前亟需解决的问题。本文针对三种应用较为广泛的图像增强算法在FT DSP平台上进行了实现,并设计了匹配该硬件特性的优化方法,为FT DSP平台上的图像增强函数库提供了支持。本文工作如下:(1)设计了Laplacian图像增强算法、盒式滤波图像增强算法与自定义滤波图像增强算法在FT平台上的整体实现流程。通过研究上述算法的原理和FT-M7002的软硬件平台特性,包括其体系架构、FT-MT2内核以及存储器层次结构,设计了面向FT-M7002的三种图像增强算法,并测试验证了上述算法实现的正确性。(2)结合三种图像增强算法的程序特点和FT DSP平台特性,设计并实现了支持多种数据类型以及不同卷积核的算法并行优化方案。通过程序热点分析,针对不同的数据类型设计了Laplacian、自定义滤波的空间可分离卷积并行算法,并分别对3*3、5*5、7*7三种卷积核进行了并行实现;设计盒式滤波的行列可分离滤波并行算法,针对不同的数据类型分别对均值、锐化、浮雕三种卷积核进行了并行实现。同时,提出了字符型与整型、短整型与整型的数据类型转换接口,解决了FT DSP平台对部分数据类型的兼容性和可扩展性问题。(3)充分利用FT DSP平台提供的超长指令字结构,通过编译优化选项、Cache高速缓存区、AM向量空间以及DMA高速传输通道等,充分利用访存优化、循环展开软流水、行列转置、DMA双缓冲区隐藏传输、尾循环处理等方式减少算法在数据存取阶段的耗时,同步数据计算与传输,填充时间空隙,解决并行单元填充不满和数据访问不连续的问题,有效地提高了算法运行效率。对优化后的图像增强算法在FT平台上进行正确性和性能测试,实验结果表明:优化后的Laplacian、盒式滤波和自定义滤波三种图像增强算法,性能分别提升了1.841~2.674倍,1.806~3.036倍和2.005~3.708倍。相较于TI-TMS320C6678DSP处理器,基于FT平台优化后的算法可分别达到1.472~2.502倍,3.479~4.056倍和3.154~3.863倍的加速效果,充分显示了国产DSP平台的高效能计算优势。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分