AI算力链更新:超节点+液冷 ...
发布者:乐晴
国产AI加速放量。根据IDC数据,2025年中国AI加速卡出货量约400万张,其中英伟达占55%,国产AI厂商占41%,国产AI厂商依次为华为20%、阿里平头哥7%、百度昆仑芯3%、寒武纪3%、海光信息2%。英伟达新AI加速卡获批前,国产AI加速卡有望持续替代英伟达市场份额。
昇腾950PR量产在即。根据路透社报道,华为昇腾950PR测试顺利并已获字节、阿里等批量订单,预计5月量产,年出货量达75万颗。CSP厂商可基于昇腾自研超节点产品,华为亦提供8、64、384、8192卡互联的解决方案。
国产AI闭环催化需求。OpenClaw等Agentic AI应用进一步催化Tokens需求。Deepseek V4发布在即,预计将深度适配国产AI芯片。国产AI瓶颈在于供给而非需求。我们预计2026年昇腾出货量上看120万颗,YoY+50%,并同步拉动上游先进制造、先进封装等相关供应链。
AI产业正面临双重指数级算力需求压力:
1)大模型参数规模从千亿级迈向万亿级,MoE 等新架构进一步推高了对互联带宽、低时延通信的极端要求;
2)AI4S等科研场景也因边际收益递减倒逼算力投入指数级增长。在此背景下,单芯片制程红利已逐步见顶,单卡算力、显存容量早已无法承载万亿参数模型训练需求,传统 8 卡服务器更是受困于通信墙、功耗墙、复杂度墙三大瓶颈,算力供给缺口持续扩大。
超节点作为整机柜级一体化紧耦合算力系统,通过将数十至数百颗 AI 芯片在物理与逻辑层面深度紧耦合,搭配高速互联协议、原生液冷、集中供电等系统级联合优化,重构了计算的局部性边界,将高频关键通信收敛在低时延、低抖动的受控域内,突破了面积、功耗、带宽的物理约束,实现了系统级算力每代 5-6 倍的跃迁式增长,较单芯片演进速度提升一倍以上,同时可将 AI 训练成本降低 30% 以上,成为破解算力瓶颈的核心路径。
NV华为领衔、国产加速进行时:
1)英伟达凭借GB200 NVL72 标杆方案率先抢占市场,依托 NVLink 私有协议构建的技术壁垒,其超节点产品成为行业早期的性能标杆,后续规划的 NVL144 方案也成为市场关注的下一代产品方向。
2)华为则依托昇腾生态快速追赶,其此前推出的 Atlas 900 A3 SuperPoD(CloudMatrix 384 超节点)已累计部署超 300 套,单集群性能已实现对英伟达 NVL72 方案的超越;今年 3 月华为进一步发布 Atlas 950 SuperPoD,该产品最大支持 8192 张昇腾 950DT 卡全光互联,FP8 算力可达 8E FLOPS,预计将于今年四季度上市。
相关:
H链:川环科技、飞龙股份、华正新材等;海光链:中科曙光。
风险提示:政策进展不及预期;下游需求不及预期;人工智能风险等。
科技板块反攻叠加业绩期来临,优先选择可能超预期的标的。大部分液冷公司业绩兑现在26Q2以后。
飞荣达:HW链芯片散热核心。HW战略供应商,昇腾液冷和鲲鹏风冷核心供应商。此外,1)NV、Google TIM材料、流量控制仪、风扇送样中;2)思科交换机液冷有望今年交付。
博杰:液冷检测设备核心。大客户覆盖NV、Google、Meta等,均已实现批量交付。此外,1)冷板模组送样海外大客户;2)持有鼎泰芯源25%股权(磷化铟衬底),今年产能预期20万片。另外,最近有边际变化的HW封装散热盖鸿日达。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!