智通财经APP获悉,中金发布研究报告称,随着大模型参数量和训练集规模大幅增加,智能计算对通信网络的需求相比于传统的通用计算有所提升。基于InfiniBand协议的网络架构相比以太网当前在性能端具备优势,但以太网也能够满足智能计算对数据中心的通信需求,在长期有望凭借经济性和通用性实现在智算中心占有率的不断提升,带动以太网生态产业链中的优质企业业绩呈现后周期成长。
▍中金主要观点如下:
智能计算对数据中心提出通信新需求,促使网络架构升级。
大模型训练的分布式计算需要GPU高频进行计算结果通信,网络流量增加,南北向流量向东西向流量转变。所以对通信网络提出超大规模组网、超高带宽、超低时延、超高稳定性和网络自动化部署新需求,典型网络架构转向多核心、少收敛形态。
英伟达采用基于InfiniBand协议的胖树型架构构建数据中心,Quantum-2系列交换机可实现51.2Tbps双向吞吐量,适用于智能计算和高性能计算。
InfiniBand是用于高性能计算的通信标准,其特性能够满足智能计算新需求。
InfiniBand多用于高性能计算集群,并持续向更高性能迭代。在发展的二十余年中,由于协议下游市场相对小众,退出者众,而最终呈现出英伟达Mellanox一枝独秀的较为封闭的产业生态。
InfiniBand的优质特性能够对应解决智算对网络通信的需求,其具有天然的自动化部署、基于信用的链路层流控机制、RDMA等功能,从而有助于实现无损网络、避免丢包,提升智能计算效率。
以太网面向高性能计算场景升级,有望凭借经济性和通用性与InfiniBand抗衡。
RoCE协议下,以太网融合RDMA功能,在高性能计算场景下的通信性能大幅提升,达到接近InfiniBand的水平;但整体而言,InfiniBand受益于技术优势,在高带宽、低时延等性能上仍略优于升级后的以太网。
为应对InfiniBand冲击,博通、AMD、思科、Arista、Meta等硬件设备和超大规模云厂商成立UEC联盟,从物理层到软件层开发高性能以太网。同时今年以来,博通、思科等多家头部以太网供应商推出高性能解决方案。
展望未来,以太网具备通用性和硬件部署经济性,在短期与InfiniBand有望形成抗衡,并随着丰富生态中参与者的合作迭代,在长期胜出;以太网生态中的头部供应商未来有望受益于AI催化下的硬件扩容和以太网占有率提升的双重利好因素。
风险
AI大模型发展不及预期;数据中心建设不及预期。