AI链更新:CPU+DPU+超...
发布者:乐晴
①美股Q1财报季即将收官:超八成企业盈利超预期,AI和芯片仍是增长主线。
②黄仁勋为即将登场的 COMPUTEX 2026 与 GTC Taipei 暖身。
③分析师预测:英伟达 Vera CPU 将在2026年中国台北电脑展上以 1.5 倍性能超越英特尔和 AMD 的 x86 芯片。
英伟达 Vera CPU 重点:6 月 1 日主题演讲将聚焦于具备代理式 AI 能力的 CPU,其速度比 x86 架构快达 1.5 倍,性能提升 2 倍,密度提高 4 倍。
Rubin Pod 布局:初期采用 1:1 的 GPU 与 CPU 配比(2 个 Vera 机架+16 个 Rubin 机架)。在代理式 AI 工作负载下,该比例有望达到 1:4。
英特尔 Wildcat Lake:面向入门级的 18A 制程 CPU(2 个性能核心+4 个低功耗能效核心,15 瓦),旨在与 MacBook Neo 竞争。52 核心的 Nova Lake 工程样品已开始测试。
服务器 CPU 市场规模:受代理式 AI 推动 CPU 密度需求激增影响,预计到 2030 年市场规模将达 2110 亿美元,年复合增长率高达 49%。
美银的 Vivek Arya 的观点最偏离市场共识,也最为看多。他表示已与管理层确认,200 亿美元对应的是 2026 年下半年的数据,因此年化运行率高达 400 亿美元!没错,400 亿美元意味着超过一半的市场份额(AMD / 英特尔今年营收约 300 亿美元)。他询问管理层英伟达是否可能占据 2030 年 2000 亿美元潜在市场的一半以上,管理层回答 “绝对可以”。他还追问管理层哪些算作 Vera 收入,对方表示只要同一封装内 Vera 旁边没有 GPU 都算,因此:
❌Vera Rubin 封装内的 Vera(1 颗 Vera+2 颗 Rubin)→不计入 200 亿美元
✅独立 Vera 机架,无论应用于何种场景(智能体编排、存储、头节点任务或其他领域)→均属于 200 亿美元市场范畴
这与乔・摩尔的框架不同 —— 他假设 200 亿美元中约 100 亿美元来自 BW/BR 机架中原本属于英伟达的头节点收入。根据维韦克的解读,与 GPU 物理集成的头节点被排除在外,这 200 亿美元更具增量性质,不过尚不明确 DRAM 是否包含在该数字中。他还指出另一个关键点:当他向英伟达提出 3000-4000 美元的平均售价时,对方表示实际价格可能更高。
美股受市场对英伟达财报高预期及美债收益率下行等利好影响,费城半导体指数涨超4%,其中CPU板块领涨:ARM股价上涨15%+,AMD 上涨近8%,Intel 上涨6%+。
英特尔CEO陈立武: Agentic AI时代的到来,正在重新定义算力需求结构。推理阶段与训练阶段存在本质差异:推理更依赖CPU的串行处理能力、实时响应能力和能效表现。 CPU:GPU使用比例正在从过去的 1:8→1:1→4:1。
英伟达VERA CPU亦是基于Armv9.2指令集构建的,市场对此寄予厚望。VERA CPU是英伟达首款专为智能体 AI (Agentic AI) 与强化学习 (RL) 设计的自研 CPU,于 26 年 3 月 16 日 GTC 大会正式发布,全球首款支持FP8 精度的 CPU。5 月 18 日向 Anthropic、OpenAI、SpaceX AI 和甲骨文交付首批产品,被黄仁勋称为公司 "下一个数十亿美元级业务"。
Agent时代,ARM架构份额提升的逻辑正在被逐步定价。
Agent时代,相比x86架构,ARM架构有诸多优势:
1)功耗与能效比:ARM 的 RISC 精简指令集在执行 AI 推理任务时,每瓦性能通常比 x86 高出 2倍,当Agent高并发运行时,这个差距直接决定了电费和散热成本。
2)ARM的核心密度更高(核心面积小,同等芯片面积内可以集成更多核心),非常适合 Agent 框架中大量轻量级并发任务的调度模式,而 x86 的单核性能虽强,但并发密度受限。
3)在端侧/边缘侧部署Agent,ARM几乎垄断。
4)总拥有成本(TCO):在大规模部署时,ARM 集群的电费和散热基础设施成本相比X86架构可以低 20–40%。
5)SoC异构集成:ARM 平台天然将 CPU、NPU、GPU 集成在单一芯片上(如高通 Snapdragon X Elite、Apple M4),Agent 的感知-推理-行动循环可以在极低延迟下完成,不需要跨总线搬运数据,而 x86 通常依赖外置 GPU,内存带宽是明显瓶颈。
6)x86 在软件生态成熟度、单线程高性能任务、高精度科学计算以及遗留企业系统兼容性上仍有优势。
Agent时代CPU内存从辅助升级为关键枢纽,SOCAMM2承接需求升级。英伟达FY27Q1业绩会强调VeraCPU打开2000亿美元新TAM,26年预计实现200亿美元CPU收入。
Agent工作流每轮推理均触发大量编排与工具调用(代码执行、数据库查询、文档检索等),此类I/O密集型任务全部由CPU执行,同时长上下文推理场景下KVCache向CPU侧内存卸载的需求增长,CPU内存将从辅助资源转变为系统运行的关键带宽/容量瓶颈。
SOCAMM2作为专为CPU侧设计的高带宽、低功耗模块化内存标准承接CPU内存需求升级。
AMD、高通均探索引入,SOCAMM2从英伟达单一生态走向多平台行业标准。SOCAMM2最初由英伟达联合三星、SK海力士、美光共同研发,将原本用于移动端的LPDDR5X引入服务器模块化形态,相比传统RDIMM实现带宽超过翻倍、功耗降低55%-75%,为CPU侧提供大容量、低功耗、可模块化替换的内存方案。
AMD披露下一代EPYC处理器Verano(27年上市)将引入SOCAMM2支持,高通也正探索引入,Rambus已于26年4月推出配套芯片组。SOCAMM2从英伟达单一生态走向多平台行业标准,有望扩大三大原厂受益边界。
三大原厂已启动SOCAMM2量产美光:首家通过英伟达量产认证,2026年3月宣布192GBSOCAMM2进入高量产,全球首批256GB样品发货。三星:2026年3月启动192GBSOCAMM2量产。
SK海力士:2026年4月宣布启动192GBSOCAMM2量产。英伟达VRNVL72单机架共54TBLPDDR5X连接至VeraCPU,比GB300NVL72的17TBLPDDR5XCPU内存增加2.2倍,且SOCAMM开发复杂度更高,生产周期更长,价值量更高,预计单机架价值增量40万美金以上,较前代CPU内存价值量增长3倍。
我们认为SOCAMM2有望成为AI服务器CPU侧标准内存接口,参考HBM在GPU侧内存的渗透路径TAM有望快速扩张,成为Agent时代AI服务器内存重要增量,进一步支撑存储景气周期。
GPU、CPU后的第三颗主芯片DPU负责网络、存储、安全、管理等数据密集型任务,在AI算网中显著降低CPU被网络等基础设施占用的算力,提效20%-50%。
1)高性能网络接口:承担服务器之间海量数据的高速传输调度,大幅降低网络延迟、提升带宽利用率。
2)编程数据路径:实现软件定义网络SDN与安全策略的硬件级执行,兼顾灵活性与高性能;加解密在 DPU 内完成,敏感数据不经过主机内存,安全性显著增强。
3)专用计算核心:内置ARM 核,运行存储虚拟化、容器网络(CNI)、遥测采集、安全隔离等系统软件栈;将“控制平面”与“计算平面”剥离。由英伟达定义、前身为SmartNIC网卡云厂为应对数据中心虚拟化开销、网络风暴、存储瓶颈等均推出SmartNIC类产品。
2019年,英伟达收购Mellanox补齐网络能力,并于2020年推出首款DPU产品Bluefield2,采用“ConnectX网卡+ARM CPU+专用加速引擎”架构。
深度赋能GPU、逐步深入推理早期DPU负责释放CPU算力,当前已经深度赋能GPU计算集群。
BlueField深度参与Spectrum-X(以太网平台),同时衍生出SuperNIC品类,专门针对大规模GPU间的流量优化。
26年3月,英伟达全新发布BlueField4 STX——以DPU为核心的AI长上下文推理存储场景系统参考架构;解决Agent时代KV Cache爆炸带来的存储瓶颈问题,Token吞吐量提升5倍、能效提升4倍、数据社区速度提升2倍。算力解耦重构、DPU需求旺盛25年全球DPU市场规模34亿美元,预计2035年达到637亿美元,未来10年CAGR~30%。
算力基础设施正在经历“组件解耦-规模化-效率提升”的正向循环,DPU是解耦的重要一环。相关:云豹智能(通过IPO辅导验收)、海光信息、浪潮信息、芯原股份、致尚科技、中兴通讯、晶晨股份(投资芯启源)、裕太微等。
5月22日:美股超节点/服务器公司大涨!
戴尔科技(DELL.US)大涨超16%,再创历史新高,市值突破1900亿美元,年内累涨近130%
惠普(HPQ.US)涨超15%。
慧与(HPE.N)涨超9%。
联想集团(0992)涨超19%
5月22日联想发布2026财报:超节点业务超预期
第四财季,AI相关收入同比增长84%,占集团总收入38%;全年AI相关收入同比增长105%,占集团收入33%。
AI服务器业务订单达到210亿美元,已完成超过5800个客户AI部署。第四财季,ISG业务如期扭亏、运营利润率创历史纪录。
“我们认为 CPU 服务器的买家画像也在向企业之外扩展。我们认为传统服务器需求不再仅仅是一个企业更新换代周期的故事 —— 它也在成为一个新云 / 超大规模基础设施的故事,这使得需求基础变得更大且更持久。”
伯恩斯坦观点:我们将戴尔视为 AI 基础设施的真正赢家 —— 也是 SK 海力士近期合规问题的最大受益者。戴尔已经在 AI 基础设施领域实现规模化,现在拥有最广泛的能力,能够通过其融资能力、直接账户覆盖、已安装基础和经过验证的部署模式,在云、企业和主权账户中捕捉被取代的 SK 海力士需求。惠普也将受益,但戴尔处于更好的位置来占据最大份额,因为它能够更积极地竞争并以更大规模执行。在我们看来,这种组合使戴尔成为参与 AI 基础设施的最高质量方式,值得溢价估值。
伯恩斯坦引用传统服务器因 AI 代理带来的增量增长,以及服务器市场份额抢占带来的额外收入,将 2028 财年每股收益预测上调 3% 至 16.47 美元。此外,将市盈率从 14 倍上调至 17 倍(基于 2028 财年每股收益),得出目标价 280 美元。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!