在WAIC 2025上,国产算力企业在超节点领域成果丰硕。华为展出昇腾384超节点,自4月10日至7月31日,其相关指数涨超30%,且全球首个商用智算昇腾超节点已落地;上海仪电联合多家企业发布光跃LightSphere X光互连光交换GPU超节点。虽超节点仍处发展初期且行业标准待确立,但有望加速国产算力渗透并带来投资机遇。
超节点方案的概念与意义
“超节点”由英伟达最先提出,是一种纵向扩展(Scale-Up)的GPU集群形态,英文名叫SuperPod,是Scale Up的当前最优解。据中科院物理所介绍,它通过内部高速总线互连,能有效支撑并行计算任务,加速GPU之间的参数交换和数据同步,缩短大模型的训练周期。壁仞科技OCS超节点项目相关负责人董朝锋表示,超节点是应对大算力集群芯片协同问题的方案,它在传统节点基础上,整合算力芯片资源,构建低延迟、高带宽的算力实体,释放更大算力。
华为昇腾384超节点的情况
早在4月10日,华为云于芜湖生态大会上发布CloudMatrix 384超节点,5月又推出昇腾超节点,实现业界最大规模的384卡高速总线互联。在WAIC的华为展区内,昇腾384超节点首次在线下展出。该超节点即Atlas 900 A3 SuperPoD,基于超节点架构,通过总线技术实现384个NPU之间大带宽低时延互联,解决集群内各资源通信瓶颈,并通过系统工程优化实现资源高效调度。从4月10日至7月31日,东方财富华为昇腾指数涨超30%,7月31日当天,相关成分股也有不同涨幅。据中国银河证券研报,华为昇腾384超节点具备超大带宽、超低时延、超强性能三大优势,性能可对标英伟达GB200NVL72,且在系统能效方面,单个超节点性能是英伟达GB200NVL72的4倍,算力能效比是其2.3倍,带宽能效比为1.8倍。目前,全球首个商用智算昇腾超节点由中国电信上线,已在广东韶关落地。
光跃LightSphere X光互连光交换GPU超节点的特点
上海仪电联合曦智科技、壁仞科技、中兴通讯发布国内首个光互连光交换GPU超节点————光跃LightSphere X。它基于曦智科技分布式光交换技术,采用硅光技术的光互连光交换(OCS)芯片和壁仞科技的大算力通用GPU液冷模组与全新载板互连,并搭载中兴通讯的AI国产服务器及仪电智算云平台软件,即将于上海仪电智算中心落地。董朝锋介绍,光跃LightSphere X具有灵活动态可配置的特点,最小可支持8卡,还能扩展至16卡、32卡甚至数千卡,可按不同大模型特征动态配置最优拓扑,且与普通单机方案相比,额外增加的光模块成本较低,集群方案性价比显著提升。
超节点领域的发展现状与趋势
董朝锋谈到,目前行业对超节点需求较多,主要基于单卡算力有限、受外部地缘因素影响,且行业发展需要一体机/超节点方案提供给终端用户。不过,多位受访对象表示,目前超节点尚未形成公认行业标准。华为展位相关负责人称华为正在联合相关部门制定标准,董朝锋也表示未来几年超节点可能逐步确立标准,壁仞科技也在与相关组织推进这一工作。尽管超节点仍处于发展初期,但申万宏源认为,其产业化将重塑算力产业链分工,催生服务器整合、光通信增量及液冷渗透提升等投资机会,如芯片厂商纵向整合趋势明显,华为CloudMatrix推动光模块需求,单机柜功率提升推动液冷渗透率提升等。
以上文章由 AI 总结生成