AI算力链更新：超节点+液冷 ...

发布者：乐晴

国产AI加速放量。根据IDC数据，2025年中国AI加速卡出货量约400万张，其中英伟达占55%，国产AI厂商占41%，国产AI厂商依次为华为20%、阿里平头哥7%、百度昆仑芯3%、寒武纪3%、海光信息2%。英伟达新AI加速卡获批前，国产AI加速卡有望持续替代英伟达市场份额。

昇腾950PR量产在即。根据路透社报道，华为昇腾950PR测试顺利并已获字节、阿里等批量订单，预计5月量产，年出货量达75万颗。CSP厂商可基于昇腾自研超节点产品，华为亦提供8、64、384、8192卡互联的解决方案。

国产AI闭环催化需求。OpenClaw等Agentic AI应用进一步催化Tokens需求。Deepseek V4发布在即，预计将深度适配国产AI芯片。国产AI瓶颈在于供给而非需求。我们预计2026年昇腾出货量上看120万颗，YoY+50%，并同步拉动上游先进制造、先进封装等相关供应链。

AI产业正面临双重指数级算力需求压力：

1）大模型参数规模从千亿级迈向万亿级，MoE 等新架构进一步推高了对互联带宽、低时延通信的极端要求；

2）AI4S等科研场景也因边际收益递减倒逼算力投入指数级增长。在此背景下，单芯片制程红利已逐步见顶，单卡算力、显存容量早已无法承载万亿参数模型训练需求，传统 8 卡服务器更是受困于通信墙、功耗墙、复杂度墙三大瓶颈，算力供给缺口持续扩大。

超节点作为整机柜级一体化紧耦合算力系统，通过将数十至数百颗 AI 芯片在物理与逻辑层面深度紧耦合，搭配高速互联协议、原生液冷、集中供电等系统级联合优化，重构了计算的局部性边界，将高频关键通信收敛在低时延、低抖动的受控域内，突破了面积、功耗、带宽的物理约束，实现了系统级算力每代 5-6 倍的跃迁式增长，较单芯片演进速度提升一倍以上，同时可将 AI 训练成本降低 30% 以上，成为破解算力瓶颈的核心路径。

NV华为领衔、国产加速进行时：

1）英伟达凭借GB200 NVL72 标杆方案率先抢占市场，依托 NVLink 私有协议构建的技术壁垒，其超节点产品成为行业早期的性能标杆，后续规划的 NVL144 方案也成为市场关注的下一代产品方向。

2）华为则依托昇腾生态快速追赶，其此前推出的 Atlas 900 A3 SuperPoD（CloudMatrix 384 超节点）已累计部署超 300 套，单集群性能已实现对英伟达 NVL72 方案的超越；今年 3 月华为进一步发布 Atlas 950 SuperPoD，该产品最大支持 8192 张昇腾 950DT 卡全光互联，FP8 算力可达 8E FLOPS，预计将于今年四季度上市。