利用LSF API实现GPU集群的并行机时统计
A parallel computation time accounting method for GPU clusters using LSF API作者机构:南京大学高性能计算中心江苏南京210093
出 版 物:《计算机时代》 (Computer Era)
年 卷 期:2020年第11期
页 面:63-65,69页
摘 要:近年来GPU的使用越来越广泛,更多的高性能计算集群采用CPU和GPU的异构架构。准确的GPU计算机时统计,是大型计算机集群执行计费政策的基础,但作业调度软件LSF并未提供简便直观的GPU计算机时统计功能。文章提出利用LSF API结合C语言、MPI和Shell脚本语言等进行编程来解决,实现多样化、可定制的GPU计算机时统计和报表制作,为高性能计算中心和超级计算中心的管理带来便利。