返回话题列表
乐晴行业观察
2025/04/29 08:47
类型 talk 13阅读 1

超节点+910+920+HW系...

发布者:乐晴

中国电信粤港澳大湾区(韶关)算力集群于4月26日正式上线全球首个商用智算昇腾超节点cloudmatrix 384,标志着新一代国产智能算力注入粤港澳大湾区国家级算力枢纽节点。

4月21日Techpowerup报道华为正在筹备昇腾920系列,其中专注于训练的昇腾920C将基于中芯国际6nm工艺打造,每张920C卡将提供超过900TFlops的BF16精度算力性能,同时内存将升级到HBM3,单卡提供4000GB/s的带宽。据内部预测,920C的整体训练效率将比910C提升30%-40%。

4月11日新华网报道华为云发布CloudMatrix384超节点,据Semianalysis分析,完整的CloudMatrix系统可以提供300PFlops的密集BF16计算能力,几近GB200NVL72两倍。硅基流动基于该超节点及SiliconLLM运行的DeepSeek-R1,在保证单用户20TPS水平前提下,单卡Decode吞吐突破1920Tokens/s,可比肩H100部署性能。

昇腾芯片对国产AI服务器零部件技术迭代、以及产品需求的推动。产业链相关厂商:中芯国际、华丰科技、深南电路、南亚新材、兴森科技、芯碁微装等。

1)4月26日全球首个商用智算昇腾超节点在中国电信粤港澳大湾区(韶关)算力集群正式商用上线!

2)4月10日华为云生态大会发布CloudMatrix384超节点,对标英伟达NVL72,超节点总算力高67%(对比 NVL72),网络互联总带宽高 107%,内存总带宽高 113%。采用 CloudMatrix 384组网的集群,可以做到万卡线性度>95%,MFU达55%,长稳定训练 40 天不中断。

3)CloudMatrix 384 超节点由昇腾 910C 组网!组网参数来看,该版本的 910C 单卡参数为:

单卡算力:781.25 Tflops单卡内存总带宽:3200 GB/s(8*HBM2e)单卡 GPU 互联带宽:400GB/s(同 910B,因封装限制)

这是昇腾 910C 正式大规模商用落地的里程碑,CloudMatrix 384方案体现了华为的系统级思维,在先进工艺受限,以堆叠换性能,不拘泥于单点性能的高低,而是从系统层级出发,实现更好的系统体验。

CloudMatrix 384 超节点可对标 NVL72,而 910C 单卡则可对标 NV H100,为国产 AI GPU 在纯训练端实现了突破!

往长看,华为 AI GPU 将按照“训推一体+纯训练”的组合,保持迭代。

从 7nm 制程的 910 系列:

训推一体:910 纯训练:910C(C 即 Chiplet,将两颗训推一体芯片拼接,成为纯训练芯片) 下一代将是 6nm 的 920 系列: 训推一体:920 纯训练:920C 国产 AI GPU 在训推一体和纯训练市场都有国产替代方案。产业链相关厂商:拓维信息、华丰科技、泰嘉股份、兴森科技、强瑞技术、通富微电、川润股份、软通动力等。

近日华为CloudMatrix 384、910C出货等关注较高,我们梳理华为系部分核心公司近期业绩与变化如下:

1)华丰科技:25Q1收入同比+80%、利润同比+207%,主要系通信产品放量+军工订单恢复。25Q1公司高速线模组出货1亿+,预计6月底二期产能扩充完毕,届时达到每月2万套的产能(对应2亿产值,粗略对应2万个910C的需求)。若下半年均满产,大致能有12亿高速线模组产值。

2)烽火通信:24年利润7亿,同比+39%,预计25年利润10亿元。24年服务器收入60亿,25年冲击100亿(我们预计鲲鹏65%,昇腾35%)。

3)神州数码:24年利润7.5亿,同比-36%(扣除神州数码国际创新中心负向影响的净利润13.05亿元)。24年自有品牌服务器45.8亿,基本都是华为服务器(36亿鲲鹏,8亿昇腾),毛利率 11.49%,税后利润0.7亿元。25年自有品牌服务器冲击60亿+。

4)菲菱科思:24年利润1.17亿元,同比-18.61%;25Q1利润0.11亿元,同比-68.66%。24年,对新华三收入8.82亿元,同比约-29%;对H客户收入6.28亿元,同比约-15%。业绩承压,主要系园区交换机需求下降、竞争加剧,但公司对H客户24年交换机销售数量同比增加42.72%。预计25年,数通交换机、服务器、汽车产品等进一步增长。

中信证券通信团队:黄亚元/李赫然

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!