咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >可选主元LU分解流水线算法设计与FPGA实现 收藏

可选主元LU分解流水线算法设计与FPGA实现

A pipelined parallel LU decomposition algorithm with column partial pivoting

作     者:牛新 周杰 窦勇 雷元武 Niu Xin;Zhou Jie;Dou Yong;Lei Yuanwu

作者机构:国防科技大学计算机学院长沙410073 

出 版 物:《高技术通讯》 (Chinese High Technology Letters)

年 卷 期:2009年第19卷第5期

页      面:511-518页

核心收录:

学科分类:080902[工学-电路与系统] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 

基  金:863计划(2007AA01Z106) 国家自然科学基金(60633050 60621003)资助项目 

主  题:LU 分解 流水线 并行算法 列主元选取 现场编程门阵列(FPGA) 

摘      要:提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与Celeron(R) 3.07GHz通用处理器主机相比可以得到平均6到7倍的加速比。与其他在FP-GA上实现的LU分解算法相比,该算法在占用相对较少资源和保持高分解效率的前提下提高了计算的精确度和稳定性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分