平衡高性能组网,推进算力网互联互通。
近日,中国电信、中国移动、中国联通联合中国信息通信研究院正式启动“算力互联网试验网”建设 。在数字中国战略推动下,算力互联网作为新型基础设施,正通过三大运营商试验网建设实现跨域资源调度与普惠化应用。如何平衡高性能组网需求与跨域异构算力资源的兼容性挑战?在推进统一标识过程中有哪些挑战?如何确保未来全国算力网的互联互通?算力定价机制和结算体系如何设计支撑规模商用?
技术路径有三个方向
《算力互联网体系架构1.0》通过设施网络层、资源互联层、业务应用层三层设计,为运营商网络升级提供了系统性框架。
对于在现有运营商网络升级过程中,如何平衡高性能组网需求与跨域异构算力资源的兼容性挑战,中国信通院云计算与大数据研究所副所长栗蔚在接受《通信产业报》全媒体采访时表示,当前技术路径主要围绕三个方向展开。
一是通过全光底座升级构建弹性传输网络,在提升单纤容量的同时,利用动态光层调度技术兼容多速率业务,降低跨域时延;二是统一算力标识体系,准化异构资源的纳管与交互方式,改善异构算力资源的兼容性;三是依托算网大脑实现智能编排,结合算力路由、差异化流水线并行等算法,动态分配任务并优化资源利用率。
在跨架构资源调度效率方面,试验网已取得初步进展。中国电信“息壤”平台,通过“五位一体”架构接入智算、超算等多元资源,实现全国算力“一张网”调度;中国移动的算网大脑验证了“中训边推”模式,通过广域高吞吐网络优化MoE模型训练效率,并结合全局内存编址技术降低跨节点通信开销;中国联通“星罗”平台则依托全光底座与网状调度算法,将跨域资源协同效率提升30%以上。
推进统一算力标识体系
算力标识体系是实现资源互联的关键,当前已完成131家企业499个算力池的标识工作。在推进统一标识过程中,有哪些挑战?《算力互联互通标准体系1.0》6项标准将如何解决这些问题?
栗蔚表示,在推进统一算力标识过程中,主要面临不同企业协议差异性问题,一是标识字段协议差异性,企业侧的云管平台、算管平台及网管平台的标识字段各不相同,一部分企业不知晓底层的服务器具体地址信息及芯片信息,另一部分企业不知晓资源池总体的资源总量信息,造成采集标识信息字段缺失的困难。二是同一标识字段的统计协议差异性,对于同一字段,企业云管平台等管理平台可以查看到相关数据,但是其底层的统计口径,各不相同,面临规范性不足的挑战。三是标识接口协议差异性问题,不同企业的云管平台等的平台架构、接口设计都不一致,在具体对接过程中,需要每家逐一适配,面临对接效率低、可重复性差等问题。
确保互联互通
三大运营商分别基于“息壤”“四算合一”“星罗”平台开展差异化试验,如何确保未来全国算力网的互联互通?中国信通院采取了以下措施。
一是明确要求三大运营商基于算力标识标准,部署企业侧算力标识网关,实现统一算力标识规范下的资源采集上报或标识转化,满足可用资源信息的实时准确上报要求。
二是基于算力互联互通对接实践,提出算力互联互通接口规范,并基于算力扩展标识体系,明确资源开通、调度、使用、运维及全生命周期管理的接口规范,满足不同服务类型及资源类型的互联互通,实现跨主体、跨架构、跨地域的互联调度。
三是基于统一账户体系及计量结算对接打通网间接口,满足用户的一点接入,多网贯通,使用户无感知地在多个试验网上跳转,并实现统一的计量计费,降低试验网互联成本。最后,整体实现屏蔽不同技术路线的全国算力网互联互通。
算力定价机制和结算体系
“按卡时购买算力”的商业模式已在北京、上海试点。从技术试验到规模商用,算力互联网的定价机制和结算体系将如何设计?栗蔚表示,算力互联网区别于传统算力供给的重要方面主要展现在算力供给形式,原有算力主要以服务器形式供给,算力定价和结算围绕服务器展开,在算力向服务的转化上还存在较长过程和较高成本。而在新型算力互联网时代里,多样算力服务将成为主要购买方式,用户无需关心底层资源架构,实现无感知服务应用。
对于算力互联网支撑中小企业发展,据悉,目前试验网已经汇聚了全国20%左右的智能算力,国家算力互联公共服务平台已经上线中小企业板块提供针对性算力入口,可有力支撑中小企业发展。栗蔚表示,算力互联网建设初衷之一便是通过汇聚全国算力资源,实时跟踪,灵活调用边侧、端侧的零散算力,一方面提高供给企业的资源池匹配效率,一方面解决中小企业“找、调、用算力难点”,通过“中训边推”最大化降低使用成本。