面向大模型的智算网络发展研究
Research on the development of intelligent computing network for large models作者机构:中国信息通信研究院云计算与大数据研究所北京100191 北京交通大学电子信息工程学院北京100044
出 版 物:《电信科学》 (Telecommunications Science)
年 卷 期:2024年第40卷第6期
页 面:137-145页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:新一代人工智能国家科技重大项目(No.2021ZD0113003)
摘 要:近年来,全球进入智能计算的蓬勃发展期,作为具有巨量参数和复杂结构的深度学习模型,大模型训练需要在多卡、多服务器间实现训练参数的快速同步,所以对算力中心网络的带宽、时延、可靠性、可扩展性和安全性等提出更高要求。研究了面向大模型训练的智算网络的需求和相关关键技术,对智算网络的研究成果、标准规范和案例实践进行了分析,以期进一步促进智算网络的发展。