AI算力链+半导体更新 ①隔...
发布者:乐晴
①隔夜美股芯片CPU巨头ARM涨16.16%,市值首次升破3000亿美元。
②海外算力租赁厂商Nebius发布信息,自6月1日开始价格上涨,隔夜NBIS上涨14.65%。
③费城半导体指数涨1.28%,连涨第三天,存储闪迪涨超10%,希捷科技涨近8%。
④英伟达最新财报取消游戏业务分类,统一并入边缘计算。
⑤华为正式发布AI DC数据基础设施全栈方案。
Nebius发布GPU定价调整通知,自6月1日起将H100、H200、B200、B300全系列GPU的按需租赁价格全面上调。
H100从2.95美元/小时涨至3.85美元/小时,涨幅31%;B200从5.50美元/小时涨至7.15美元/小时,涨幅30%。
国内方面,腾讯云、阿里云、百度云等主要云供应商2026年上半年已集体将AI相关服务价格上调5%至400%不等。
2026年5月黄仁勋称:即便是发布已有四至五年的旧款GPU,其价格不仅没有随时间贬值,反而像陈年佳酿一样越陈越香,持续升值。CoreWeave表示:其运营的H100、H200、L40S以及A100等主流型号GPU,季度价格涨幅达15%-20%,且算力资源长期处于“上架即售罄”的状态。
国海计算机·刘熹团队
1)NBIS上调价格,H100从2.95美元/小时涨至3.85美元/小时;B200从5.50美元/小时涨至7.15美元/小时。涨幅均达到30%。国内云厂此前也纷纷上调云算力价格。
2)算力租赁方向上,我们看到大订单持续落地,同时①或出海②在探索新的商业模式(如tokens分成形式)。今年或能看到核心厂商业绩和盈利的释放。同时我们一直认为算力卡残值被忽视,算力卡使用几年后仍然具备较高的使用价值。
3)运营商发布tokens套餐,此外anthropic持续验证商业闭环。国内TOKENs使用量持续高增。
4)算力租赁核心绑定csp大厂/运营商/大模型大客户的相关厂商梳理(不构成投资建议)
①tokens工厂分成核心:润建股份
②大厂算租规模:协创数据,润泽科技、宏景科技、利通电子等
③算租和算力服务新入厂商:彩讯股份、蜂助手、东阳光等
天风通信王奕红/唐海清/袁昊
Token调用量指数级爆发,产业进入规模化落地阶段。
围绕Token的商业模式持续成熟:Token经济正在重塑云服务与AI技术的产业格局,同时其对内容产业的影响正从“效率提升”迈向“生产方式重构”。
Token服务型商业模式成型:聚合平台、云厂商MaaS、AI中转站三足鼎立:
1)Token聚合平台 以OpenRouter为代表,靠价差与手续费快速成长为独角兽;
2)云厂商MaaS服务 面向企业提供统一计费与合规方案,国内MaaS市场高速增长,云商转向Token生态化运营;
3)AI中转站 则通过跨境差价套利活跃于二级市场,同时国产模型性价比优势也催生Token出口新机会。
在应用落地层面,Token经济率先在AI剧、营销与电商实现规模化变现:
AI剧 大幅降本增效,市场规模快速扩张,成为微短剧新增长极,Token消耗占生产成本近半;
AI营销 迈入全链路智能体时代,正同时受生成式AI与AI智能体两大技术曲线的催化,Token流转效率的持续提升,将从ToB/ToC两端对AI营销形成正向强化。
方向清晰:关注大模型、AI营销+电商+Token运营、娱乐内容三大核心赛道:
AI大模型 :智谱、MiniMax、阿里巴巴、腾讯;
AI影视内容生成与多模态内容 :荣信文化、中文在线、昆仑万维、掌阅科技、华策影视、博纳影视等;
全链路AI营销+电商+Token运营 :易点天下、汇量科技、蓝色光标、值得买、青木科技等。
在大模型训练阶段,以GPU为核心的矩阵计算能力是决定模型能力的核心。从2H25起,出现了两方面变化:
1)在训练侧,强化学习的重要性提升,使得CPU/GPU配比成为了系统的关键指标之一;
2)在推理侧主要有三个领域:a) 推理Host
CPU,配合GPU进行任务调度和利用率优化等,甚至执行简单推理任务,形成对GPU的替代作用;b)编排节点CPU,在复杂agentic任务中,作为独立节点承担逻辑运算并进行任务编排;c) 沙盒执行层随并发任务数增加带来CPU需求。
AI驱动下,CPU市场规模有多大?我们从两个维度尝试进行测算:
1)中性基于GPU:CPU=1:1配比估计下,测算至2030年全球CPU市场规模将超1300亿美元;
2)测算Agentic AI当前情景下(5亿DAU或300亿日均token)对CPU的新增需求大约为840万颗。
从技术发展趋势看,作为新操作系统的“调度器”CPU的升级趋势包括更强的单核性能、更大的内存带宽、更强的I/O能力、更多核心数。
长期来看,我们预计数据中心CPU迭代将围绕三条主线展开:数据带宽能力提升、任务分工专业化,以及与加速器的深度融合。此外,在需求快速增长情况下,我们认为2026年服务器CPU涨价趋势有望持续 。
x86 vs Arm,谁将胜出?目前全球服务器CPU市场中Arm市占率不到20%,仍以x86架构为主。考虑Agent类产品拥有高并发、持续运行、大量轻量级推理请求的特点,Arm精简指令集的功耗效率占优,可以支持更多核心处理并发请求,适用于高吞吐的推理服务,我们预计未来其份额或将提升。相关:服务器CPU核心厂商,AMD、高通、海光、龙芯、禾盛等,建议关注Arm。
过去三年,CPU在全球算力产业链中持续边缘化。随着今年CPU市场缺货和涨价的持续加剧,以及Agentic AI的爆发,正加速市场对CPU底层价值的认知重构。
传统LLM推理是GPU/内存密集型任务,而智能体涉及观察环境、执行推理、做出决策、执行行动的多步推理循环,均需要CPU来进行处理,对CPU的计算和调度需求开始大幅提升。
相较于GPU/内存,CPU是更难以被优化和压缩的计算资源。CPU无法享受AI算法的量化与稀疏化红利,同时具有严格的因果串行逻辑。在可预见的产业周期内,CPU出现“DeekSeek/TurboQuant时刻”的概率极低。
Agentic AI不仅带来了AI服务器内CPU数量的增加,同时也催生出庞大的独立CPU服务器计算节点的需求。在AI推理机柜中,GPU/CPU配比正在从8:1到8:2,提升至2:1;同时Agent框架运行和沙箱执行也将带来柜外CPU需求的大幅增加。
Arm CEO指出,目前AI数据中心每GW约需要三千万颗CPU核心,未来CPU核心需求提升至每GW一亿两千万颗,成长四倍。同时在Intel在2026Q1电话会上也表示未来的CPU与GPU配比将从现在的8:1提升至1:1。
产业相关:1)CPU芯片:海光信息、龙芯中科、中国长城、Intel、AMD、Arm、Qualcomm等;2)内存接口芯片/CXL相关器件:澜起科技、聚辰股份等;3)服务器:中科曙光、浪潮信息、紫光股份、华勤技术等。
建投计算机应瑛/方闻千
英特尔CEO大幅上修CPU远期需求,验证我们前期判断。
5月19日,在摩根大通第54届全球科技、媒体与通信年会上,英特尔CEO陈立武表示,随着AI从训练转向推理,CPU在AI时代日益重要且不可或缺,CPU与GPU的配置比例从1:8向1:1靠拢,甚至可达4:1。这符合我们此前报告中的判断“AI Agent在各行业的渗透有望推动CPU呈现数量扩张与性能升级的双重趋势。”
我们在1月23日的报告《AI agent的大规模应用驱动CPU和基础软件需求增长》中提到:AI Agent执行的工具调用、多智能体协同等控制类任务,均属CPU密集型工作,而GPU难以替代。
在多智能体协作的场景下,大规模并行运行的AI Agent将较大程度依赖CPU进程数、核心数以及单核性能等硬件资源。
为满足AI agent的应用,一方面,服务器CPU配置正从传统8-16核,向32-64核及更高规格演进;另一方面,在算力集群中配置更多数量的CPU或成为各厂商尝试的新路径。
CPU和GPU的配置比例持续提升的趋势确定。我们在1月25日的报告《AI agent对CPU需求增加》中提到“目前每个GPU兆瓦(MW)对应的CPU配比低于10%,预计到2026Q2,每个GPU兆瓦(MW)对应的CPU配比将上升至15%。”
此次,英特尔CEO陈立武给出的CPU和GPU的配置比例相关量化指标较我们此前的判断更加乐观。
从产业趋势来看,CPU和GPU的配置比例持续提升的趋势确定,但具体配置比例变化的节奏仍取决于技术架构的发展,仍需进一步观察。
从国内竞争格局来看,X86架构的国产CPU产品的特点更加明显。在AI Agent的应用拉动CPU需求增长的过程中,国内外CPU公司有望共同受益于技术架构升级带来的潜在市场规模扩大的趋势。
从生态角度来看,X86架构的生态更为成熟,相关国产CPU公司以独立第三方定位,在基础软硬件领域积极拓展行业合作伙伴的,已具备较好的生态条件。AI agent带来CPU占比提升的趋势有望推动CPU远期市场空间的突破,有望进一步增强X86架构的国产CPU厂商成长的确定性和持续性。
龙头Intel/AMD重申CPU配比高增
本周AMD中国行,CEO苏姿丰表示数据中心CPU与GPU配比正从1:4/8,向1:1靠拢;5.20日摩根大通年会,Intel CEO陈立武表示随着AI从训练转向推理,CPU与GPU配比从1:8向1:1靠拢,甚至可达4:1。CPU两大龙头重申配比提升,坚定看好AI推理时代CPU将迎价值重估。
Agent成为CPU放量核心支撑
Agent会将目标拆分成若干子任务→依次调用不同模型做推理→模型之间传递数据→生成结果→汇总检查等。 上述流程GPU只负责“调用模型做推理”,其余分配任务、搬运数据、调用工具、检查结果、沙箱隔离等均由CPU完成。因此在Agent模式下,CPU工作耗时占比大幅提升,迸发大量需求,当前已成为核心瓶颈,需求同步爆发。
持续重视CPU产业机遇
26Q1业绩交流会AMD上调30年全球服务器CPU市场规模预期至1200亿美元以上;英伟达在FY27Q1电话会表示Vera CPU今年预期近200亿美元营收,开辟2000亿美元全新市场。随着推理时代尤其是Agent场景爆发,CPU未来增量空间广阔,充分看好产业机遇。相关:海光信息、广合科、龙芯中科、禾盛新材、澜起科技、通富微电等。
风险提示:行业竞争加剧,下游需求不及预期等。
18A良率超预期物理AI为下一重点。
1)从英特尔最新制造业务进展来看,其 18A 制程良率实现每月 7% 的稳步提升,改善节奏超出此前预期,基于 18A 节点的 Panther Lake 产品线已落地并收获 200 项客户设计订单;代工业务按节点稳步推进,一季度已发布 PDK 0.5 版供客户测试芯片流片,计划今年 10 月开放 PDK 0.9 版,14A 节点已实现客户实质对接,10A、7A 先进工艺路线图亦有序落地,同时公司 EMIB-T 先进封装技术获得多家客户青睐。
2)在新兴赛道布局上,英特尔锚定物理 AI 作为下一战略高地,通过引入高通核心高管搭建全栈业务体系,从芯片底层优化、软件适配到系统平台工程进行完整布局,同时调整 CPU 架构、联动外部企业强化加速器能力,整合先进封装与代工产能切入 ASIC 定制芯片赛道,全面覆盖机器人、数字虚拟员工等物理 AI 应用场景。
传统配比逻辑已变CPU价值仍被低估。
行业 AI 算力配比格局正迎来深度重构,传统 AI 训练阶段 1CPU 配 8GPU 的固有配比逻辑逐步弱化,CPU 长期存在价值被市场低估的情况。
在 Agentic AI 发展浪潮下,AI 推理场景对 CPU 串行处理、实时响应及能效优势需求凸显,叠加强化学习、多智能体编排等工作负载的兴起,CPU 在算力体系中的权重显著抬升。
我们认为后续 CPU 与 GPU 配比已从过往 1:8,逐步转向 1:1 甚至 CPU 占比更高的 4:1 结构,英特尔以及其它CPU厂商凭借自身 CPU 领域传统优势,有望充分受益于 AI 推理侧算力需求结构变迁带来的行业红利。
CPU:海光信息、禾盛新材等;
CPU上游:德福科技、凌玮科技、圣泉集团、东材科技、华正新材、呈和科技、宏和科技等;
服务器:中科曙光、浪潮信息、紫光股份;
虚拟化:优刻得、首都在线、青云科技等。
风险提示:政策进展不及预期;下游需求不及预期;人工智能风险等。
赵宇阳
Vera CPU 为 Nvidia 打开了一个全新的 2000 亿美元 TAM。ARM 最近在超大规模计算 CPU 市场拿下了 50% 的份额,这一增长主要受 Grace 在 Grace-Blackwell 部署中取得成功的推动。
“我们认为,Arm 目前给出的 AGI CPU 收入指引 —— 从 28 财年的 10 亿美元增长到 31 财年的 150 亿美元 —— 很可能偏保守。”
“鉴于到 31 财年 TAM 看起来更可能接近 2000 亿美元,而非 Arm 给出的 1000 亿美元,该公司当年的 AGI CPU 收入也很可能远高于此。”
在电话会议上,英伟达表示,预计独立的 Vera CPU 市场在 2027 财年将达到 200 亿美元。
Grace CPU 的单价估计在 3000 到 5000 美元左右。
由于 Vera 是 Grace 的继任者,并针对 AI Agent 工作负载进行了优化,我们预计 Vera 的平均销售价格会更高,大约在每颗 5000 到 8000 美元。
假设 Vera CPU 的平均销售价格为 8000 美元,200 亿美元的市场意味着 2500 万颗 CPU。
目前尚不清楚独立的 Vera CPU 销售是否会包含与 NVL72 相同的 SoC AMM 容量。
不过,假设采用相同的容量,每颗 Vera CPU 将拥有 8 个 SoC AMM 插槽。
每个模组为 192GB,那么每颗 Vera CPU 的 SoC AMM 容量将为 1536GB。
因此,2027 财年 Vera CPU 的 SoC AMM 需求将为:2500 万颗 CPU × 1536GB = 38.4 亿 GB,即 307.2 亿 Gb。
2026 自然年与英伟达的 2027 财年大致重叠,三大 DRAM 制造商的 SoC AMM 供应量估计为 300 亿 Gb。
因此,仅英伟达独立的 Vera CPU 销售和 NVL72 的供应带来的 SoC AMM 总需求,似乎就已经可能超过 300 亿 Gb 的年度供应能力。
在我们之前的深度报告中,假设 2027 自然年 VR NVL72 的出货量为 10 万台服务器,我们基于 192GB 模组估算的 SoC AMM TAM 为 440 亿 Gb。
2027 年的 SoC AMM TAM 可能超过 800 亿 Gb。
每年 800 亿 Gb 的 LPDDR5 几乎相当于智能手机所用的年度 LPDDR5 TAM。
LPDDR5 以及整体 DRAM 的短缺,可能会随着时间的推移进一步加剧。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!