SCC上FFT的高效并行实现及其扩展性研究
Efficient Parallel Implementation of FFT on SCC and SCC's Expansibility Research作者机构:中国科学技术大学计算机学院合肥230027 安徽省计算与通信软件重点实验室合肥230027
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2014年第35卷第6期
页 面:1207-1211页
核心收录:
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
基 金:国家"核高基"重大专项(2009ZX01028-002-003-005)资助 国家自然科学基金项目(60833004)资助
摘 要:针对SCC(Single-Chip Cloud Computer,单芯片云计算机)体系结构,通过通信路由的改进、消息传递的预处理以及数据处理的再划分这三种手段来提升FFT并行实现效率并以此来研究SCC的扩展性.实验结果表明,SCC上改进后的FFT在一定规模内,双核下的平均加速比为4.10倍,最高可达4.78倍;四核下平均加速比为6.01倍,最高可达6.77倍;八核下平均加速比为10.46倍,最高可达11.53倍;十六核下平均加速比为16.20倍,最高可达18.51倍;三十二核下平均加速比为21.17倍,最高可达到24.20倍.并且随着规模的增加,核间通信带宽趋于稳定,三十二核的加速比也逐渐增大,结果显示SCC具有良好的可扩展性.