HPC混合型互连网络容错路由算法研究
作者单位:国防科技大学计算机学院
会议名称:《第十六届计算机工程与工艺年会暨第二届微处理器技术论坛》
会议日期:2012年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
关 键 词:内部互连网络 3D-Torus 全相连网络 容错路由算法 死锁
摘 要:内部高速互连网络作为大规模并行计算机系统的核心,在HPC的研制中至关重要,而容错技术随着HPC系统规模和复杂度的不断扩大也越来越受到重视。根据最新HPC内部互连网络的分类,以高维Mesh/Torus结构为主,介绍了高维混合型内部互连网络的拓扑结构,和基于这种拓扑的主流容错路由算法。并介绍了全相连网络,提出了适用于此种网络的两种容错路由算法,给出了算法无死锁、无活锁的证明。通过对未来HPC内部互连网络拓扑结构发展的预测,提出了针对高维Torus/Mesh结构与全相连拓扑结合的混合型结构的容错路由算法,并给出了解决混合算法死锁问题的策略。