咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Beacon^(+):面向E级超级计算机的轻量级端到端I/O... 收藏

Beacon^(+):面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统

Beacon+:A scalable lightweight end-to-end I/O performance monitoring,analysis and diagnosis system for exascale supercomputers

作     者:杨斌 王敬宇 刘世超 邵明山 肖伟 陈起 何晓斌 刘卫国 薛巍 YANG Bin;WANG Jing-yu;LIU Shi-chao;SHAO Ming-shan;XIAO Wei;Chen Qi;HE Xiao-bin;LIU Wei-guo;XUE Wei

作者机构:山东大学软件学院山东济南250101 国家超级计算无锡中心江苏无锡214072 国家并行计算机工程技术研究中心北京100080 清华大学计算机科学与技术系北京100084 

出 版 物:《计算机工程与科学》 (Computer Engineering & Science)

年 卷 期:2022年第44卷第9期

页      面:1521-1531页

学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家重点研发计划(2020YFA0607900) 

主  题:I/O监控 数据压缩 I/O诊断 异常检测 性能瓶颈优化 

摘      要:随着E级计算的屏障被打破,高性能计算已经迈入了新时代。为了满足日益增长的数据访问需求,新兴的技术和存储介质都被运用到了超级计算机中,这使得其架构变得日趋复杂,其性能异常和系统热点定位也变得十分困难。为此,设计并实现了一个面向E级超级计算机的轻量级端到端I/O性能监控与分析诊断系统——Beacon^(+)。该系统无需修改应用代码/脚本即可对每个应用的数据访问过程进行全路径实时监控与分析。通过在线+离线的压缩方法和分布式缓存/存储等机制,Beacon^(+)在保证系统本身高扩展性、低开销的同时还可以持续稳定地提供I/O诊断服务。以神威新一代超级计算机为部署平台,通过I/O标准测试应用和实际应用证明了Beacon^(+)的低开销和高准确性,以及I/O诊断的高效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分