返回话题列表
乐晴行业观察
2025/04/15 08:51
类型 talk 7阅读 1

国产算力芯片+910C更新 ...

发布者:乐晴

华为公布AI基础设施架构的新进展,推出CloudMatrix384超节点,并已在芜湖数据中心规模上线。

CloudMatrix 384 超节点,对标英伟达NVL72,超节点总算力高67%(对比 NVL72),网络互联总带宽高 107%,内存总带宽高 113%。

华为云CloudMatrix384超节点今年上半年将有数万规模的上线。华为内部人士称其为核弹级的产品,或将彻底终结算力焦虑。

未来CloudMatrix超节点可以构建超过万片的大集群来提供算力。

采用 CloudMatrix 384组网的集群,可以做到万卡线性度>95%,MFU达55%,长稳定训练 40 天不中断。

CloudMatrix 384 超节点由昇腾 910C 组网!组网参数来看,该版本的 910C 单卡参数为:

781.25 Tflops 3200 GB/s(8*HBM2e) 400GB/s(同 910B,因封装限制)

解读:这是昇腾 910C 正式大规模商用落地的里程碑,CloudMatrix 384方案体现了华为的系统级思维,在先进工艺受限,以堆叠换性能,不拘泥于单点性能的高低,而是从系统层级出发,实现更好的系统体验。

CloudMatrix 384 超节点可对标 NVL72,而 910C 单卡则可对标 NV H100,为国产 AI GPU 在纯训练端实现了突破!

往长看,华为 AI GPU 将按照“训推一体+纯训练”的组合,保持迭代。

910 910C(C 即 Chiplet,将两颗训推一体芯片拼接,成为纯训练芯片) 920 920C

国产 AI GPU 在训推一体和纯训练市场都有了国产替代方案!

CloudMatrix384超节点高速互联带宽有望加速国产算力卡向训练场景突破。伴随硬件性能提升与软件架构迭代,国产AI算力芯片需求有望加速增长。

1)CloudMatrix 384超节点发布,其采用新型高速总线升级互联带宽,单卡decode吞吐对标H100。昇思Mindspore 2.6全面支持类Deepseek V3/R1 MOE架构模型,系统吞吐率提升2.8倍。伴随硬件性能提升与软件架构迭代,国产AI算力芯片需求有望加速增长。推荐标的:中芯国际、华丰科技、兴森科技、芯碁微装。

2)硬件:CloudMatrix 384超节点发布,国产AI算力基础设施升级。根据2025年4月10日举办的华为云生态大会,CloudMatrix 384超节点采用新型高速总线,通过统一内存编制、通信升级互联带宽,有效提升推理性能。根据硅基流动微信公众号,384超节点可在单用户20TPS前提下,实现单卡decode吞吐1920 tokens/s,与H100性能相当。并且CloudMatrix 384超节点高速互联带宽有望加速国产算力卡向训练场景突破。

3)软件:昇思发布Mindspore 2.6,加速开发大模型一体化部署方案。根据2025年4月12日举办的昇思开发者大会,MindSpore 2.6全面支持类Deepseek V3/R1 MOE架构模型:

-支持高性能MOE预训练,性能提高30%;

-发布新的后训练学习套件GRPO等,支持deepseek,千问等模型的GRPO训练以及DRO/PPO等算法,支持训推一体;

-适配支持vLLM原生接口,支持Deepseek V3/R1 Int8量化,新增10+推理融合大算子,系统吞吐率提升2.8倍。并且昇思联合北大、openeuler提供大模型一体化软件方案,整合deepseek、Mindspore、openeuler、VLLM开源组件,支持大模型快速部署服务。

未来昇思生态将持续演进,预计Mindspore 2.7将支持大EP并行能力,实现多模态生成模型Day0迁移,将进一步加速Altas 800 A3超节点推理速率。

4)催化剂:CloudMatrix 384超节点量产落地

- 传长鑫存储近期开始扩产HBM,5000片8层晶圆,尚未证实 - 中科飞测增发募集说明书,拟募资25亿元,主要投向量检测设备 - 华强北市场(深圳华强)多款热门芯片“封库存” - 翱捷科技投关记录:第二代4G 8核,计划今年年中流片,预计26H1逐步进入量产阶段。第一颗5G智能手机芯片,预计年底前流片,明年年底量产。

海外芯片受关税政策影响较大。自2025年4月12日起,中国调整对原产于美国的进口商品加征关税措施,关税税率由84%提高至125%。

按照中国半导体行业协会的通知,海外产品进口到中国报关时的原产地以“晶圆流片工厂”所在地为准申报。

受关税政策影响,从美国晶圆厂流片的英特尔和AMD的CPU出口到国内进行销售,其性价比和竞争力或大幅削弱。

中国是英特尔最大的下游市场,中美关税政策变化对其业务影响较大。

2024年,英特尔营收531亿美元,其中中国大陆给其贡献营收155亿美元,占其营收比例为29%。英特尔的产品在中国大陆的销售金额超过其在本土美国市场的销售金额,而英特尔主要的晶圆厂位于美国境内。在中国对美方出口产品加征关税税率提升至125%的情况下,国内PC厂商、服务器厂商以及边缘计算设备厂商采购英特尔芯片的原材料成本将升高,不仅增加相应硬件产品制造环节的成本,若终端硬件产品涨价,或影响终端客户的采购意愿。 AMD受关税政策影响较小。2024年,AMD营收258亿美元,其中中国大陆给其贡献营收62亿美元,占其营收比例为24%。

AMD的产品在中国大陆的销售金额少于其在本土美国市场的销售金额。另一方面,AMD设计的芯片主要通过台积电和格罗方德的晶圆厂生产制造。相较于英特尔的晶圆厂更加集中于美国地区,格罗方德的晶圆厂在地理上的分布更为分散。考虑到在美国境外晶圆厂生产的芯片出口到中国,不受关税政策的影响,AMD受关税政策的影响相对较小。 国产CPU迎来快速发展机遇。在关税政策的影响下,英特尔、AMD等海外芯片出口至中国将收取较高的关税。

相较而言,鲲鹏等国产CPU的性价比优势有所提升。外部环境的变化给CPU国产替代带来了较好的发展机遇。海光信息、龙芯中科等国产CPU,以及神州数码、拓维信息、中科曙光等国产整机厂商均受益于CPU国产替代趋势加速的趋势。

海光和鲲鹏芯片处于国产CPU的第一梯队。海光信息的芯片兼容主流x86生态,产品各项指标处于领先地位;采取ARM架构的鲲鹏芯片性能不断提升,在华为的推动下,兼容ARM架构的国产操作系统、数据库等基础软件纷纷推出,兼容性得到显著增强。此外,从实际商业化落地的情况来看,海光和鲲鹏芯片在电信、金融行业已实现规模化出货,在国产CPU中处于第一梯队。

杰华特是电源管理起家的虚拟IDM模拟厂商,主要产品以AC-DC芯片为主,同时在DC-DC芯片、线性电源芯片和电池管理芯片上进行持续投入和布局,且华为哈勃持有公司3.03%的股权。

艾为电子已形成高性能数模混合芯片电源管理信号链三条产品线的平台化模式,并全面突破拥抱AI,高端产品正持续渗透,且随着AI持续落地端侧,各项交互都需要模拟芯片的配套升级,有望带动单机价值量持续提升。

风险提示。关税政策变动的不确定性;国产CPU在生态和供应链稳定性方面差距;PC和服务器端CPU供应链不确定性增加。

*本文仅作为行业分析和信息分享参考,不构成任何投资建议!