返回话题列表
乐晴行业观察
2026/05/06 22:33
类型 talk 5阅读 1

AI链CPU更新 1、CPU...

发布者:乐晴

显存墙与数据洪峰逐渐成为大模型性能的掣肘,CPU的重要性开始凸显。在大模型向万亿参数及超长上下文演进的过程中,数据吞吐与内存调度的效率正成为决定系统性能的关键瓶颈。

随着上下文窗口跨越百万级,昂贵的HBM显存已难以承载庞大的KV Cache,这迫使架构设计转向内存卸载方案。

CPU凭借其管理廉价的DDR内存,成为了显存之外不可或缺的动态缓冲池。同时,多模态数据的爆发要求CPU在数据喂入GPU之前,必须完成高强度的实时编解码与特征对齐。我们认为CPU从过去辅助角色逐渐转变为存算的控制枢纽,将促使CPU在新一轮AI浪潮中的战略地位显著提升。

​强化学习推高异构计算需求,CPU成为Agent时代的逻辑执行底座。强化学习的引入是大模型进化的分水岭,它对CPU性能提出了更高要求。在强化学习训练中,系统需同时运行策略、参考、奖励等多个模型,CPU不仅要负责多模型间复杂的梯度聚合与参数同步,更要在采样阶段支撑大规模并行的环境交互与逻辑判别。

随着大模型向具有自主规划能力的Agent演进,工作流中非计算密集型任务(如工具调用、API编排、长程逻辑推理)的占比将不断飙升。这类更偏逻辑的任务正是CPU的架构优势所在。我们认为随着Agent的普及,CPU的需求量将呈现快速增长,CPU与GPU配比有望逐步提升。

​高端产能受限倒逼CPU价值中枢上移,CPU涨价持续性有望超预期。从供应链维度看,苹果、英伟达等巨头已锁定台积电等代工厂的先进制程及CoWoS封装的主要产能,CPU产能受到限制,在当前CPU景气度逐步提升的情况下进一步推升CPU价格。

近日IT之家消息显示, AI 算力需求激增导致AMD、英特尔等CPU产品涨价,其中消费级 CPU 价格在今年 3 月上涨 5%~10%,服务器 CPU 涨幅达 10-20%,三季度还有望迎来涨价。我们认为当前AI的发展演进中,CPU的需求有望迎来快速增长,供给端的受限有望推升CPU价格,市场目前低估了CPU涨价的持续性。

​ 我们认为国产CPU厂商及产业链也同样能在AI发展的浪潮中受益,相关:海光信息、龙芯中科、中国长城、禾盛新材、品高股份、卓易信息。

风险提示行业竞争加剧,CPU涨价持续性不及预期

1)CPU涨价的主要驱动因素是Fab厂产能紧缺,25年下半年Fab厂涨价后,价格先传导到消费级CPU,服务器CPU因为有锁价等原因,现在开始涨价。我们判断,此轮涨价周期会非常长。

2)AI对CPU的计算提出了新的需求:数量和质量,AI计算要求CPU的I/O足够强和内核尽可能的多,加快迭代速度和更新周期。Agent推理的需求也进一步加大对CPU的迭代。

3)国产CPU在过去三年时间里,计算性能和软件兼容性大幅改善,国内产能也得到了解决。之前性能领先的海光,产品持续迭代的龙芯,产能受限的飞腾都有机会扩大出货量。26年国产CPU的份额有望翻倍。

AMD业绩及指引超预期,CPU板块整体大涨

AMD今天交出超预期的业绩,Q1数据中心部门收入大增57%,Q2季度112亿收入指引(YoY+46%)也超出市场预期,CEO预计服务器业务增长有望进一步提速,公司股价在盘后上涨近15%。英特尔股价也在苹果合作的预期下大涨13%左右。我们再次重申此前观点,认为CPU需求提升(长期看与GPU配比将达到1:1)与涨价持续性都可能超出投资者预期,国内CPU公司也将借助此机会扩大国内市场份额。

豆包开始收费,token经济学有望更好落地

根据媒体报道,豆包计划在APP Store推出付费订阅版,三档定价分别为68元/200元/500元/月,我们认为豆包收费是重要标志,意味着其在达到3.45亿月活用户后,开始把付费运营与转化作为重心,一方面有利于AI应用付费习惯的形成、降低算力投入压力,另一方面也有利于其与上游算力服务商形成token服务的商业模式。此外,从Nebius收购Eigen AI转型token工厂也可以看出,token工厂将是算租的下一步。昨晚东阳光算力大单也有较高的关注度。相关:润建股份、东阳光、协创数据、宏景科技、智微智能等。

Anthropic ARR进一步加速至440亿美金,卓易信息4月收入也环比大增

根据媒体报道,Anthropic的年化收入从3月份的300亿美金上升为4月的440亿美金,主要是Claude Code等产品的贡献,增速进一步加快,说明AI Coding仍在加速渗透。卓易信息也发布信息,4月EazyDevelop产品订单3200万、超1-3月总和,也体现出增长加速的特点。

1)GPU:CPU从8:1走向翻转,Agentic AI重塑算力分工

传统AI服务器逻辑是"GPU做矩阵运算,CPU打辅助",Agentic AI工作负载不同:模型在推理链路中频繁发起工具调用(联网搜索、代码执行、数据库查询、API调度),这些任务全部在CPU上完成。实测数据显示,工具密集型agentic场景中CPU端处理时间最高占端到端延迟的88%,GPU处于等待状态。CPU成为直接决定用户体验的系统性瓶颈。从GPU:CPU部署配比看,训练阶段约7–8:1,进入推理阶段已收窄至3–4:1,agentic/multi-agent阶段这一比例有望进一步向CPU倾斜甚至翻转——CPU需求量的增长速度开始超过GPU。

2)配比上移 × socket ASP双升,价值量翻倍

当前主流AI服务器1个CPU/socket;Agentic场景下工具调用并发量随agent数量线性增长,增加CPU是提升系统吞吐的最直接路径。预计Agentic专用服务器CPU数量向2–4个迁移,对应socket数量同步翻倍。

Socket引脚数提升有三重驱动:①内存带宽扩张——每新增一组DDR5内存通道需约150个引脚,下一代服务器CPU内存通道数持续增加以支撑更大KV cache和工具调用数据;②PCIe通道扩容——连接更多GPU/NVMe/NIC需要更多PCIe lanes,每条lane对应4个信号引脚;③功耗提升——核心数增加导致TDP上升,需要更多电源/地线引脚承载电流。三重因素叠加,下一代服务器socket引脚数从当前4,000级升至8,000级。

Socket连接器ASP随引脚数同步提升:当前服务器主流socket约4,000引脚级,单价$40–60/个;下一代升至8,000引脚级,单价$100+/个。

看好Agentic AI驱动CPU socket配比提升与引脚数升级共振,量价双击逻辑清晰; CPU socket连接器龙头鸿腾精密。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!