半导体更新：CPU+GPU直存...

发布者：乐晴

①隔夜费城半导体指数暴涨4.49%，30只成分股中仅一家收跌。

②CPU表现强势，Arm Holdings涨15.05%，AMD涨8.1%，英特尔涨7.36%。

③英特尔CEO陈立武最新表态：CPU与GPU比例向4:1演进。

④英伟达Vera Rubin或联合AWS推GPU直存（GIDS），GPU直控SSD有望为堆叠NAND的HBF打开大门。

5月20日，INTEL在摩根大通全球科技会议上明确指出，AI推理负载正推动算力架构发生根本性重构，CPU与GPU的使用比例已从此前行业默认的1:8向1:1甚至4:1演进。

陈立武特别强调，这一判断来自与多家前沿模型公司和AI创业企业的深度交流——强化学习与多智能体编排等工作负载，使得CPU在端到端推理链路中的角色正从辅助转向核心。

AI推理时代、CPU将成价值锚点，ARM中期弹性更大。

Agent工作负载的碎片化调用与长链路编排特性，决定了CPU耗时占比可达端到端延迟的40%至90%，GPU的单卡算力优势在此场景下不再是唯一变量。相较于推理侧GPU，CPU的需求弹性远被低估。中期维度看，ARM架构凭借能效比与可扩展性优势，在云原生推理场景中的渗透斜率将更为陡峭，产业变局深度值得重视。

涨价潮已至，Intel与AMD提价，国产CPU有望批量供货CSP。

过去四个月，两家巨头库存持续趋紧并启动多轮提价，验证了我们报告中“CPU再涨价趋势确立”的预判。国内方面，国产CPU逐步突破CSP供应链壁垒，自主可控进程与需求周期形成共振。

重申看好CPU赛道

风险提示：AI推理需求落地节奏不及预期；国产替代进程存在不确定性；下游CSP资本开支或出现阶段性波动。

在摩根大通第54届全球科技、媒体与通信会议上，英特尔CEO陈立武表示CPU在AI算力中的配比格局正在发生根本性变化。

陈立武透露，自己与多家前沿模型公司和AI创企进行了深入交流。这些企业传递了一个明确信号：CPU的价值被低估。“即使在单线程场景下，CPU也展现出强大的实用性。更关键的是，在强化学习、多智能体编排以及工作负载优化等环节，CPU的作用越发重要。”

陈立武判断，Agentic AI正在重新定义算力需求结构。推理阶段与训练阶段存在本质差异：推理更依赖CPU的串行处理能力、实时响应能力和能效表现。“已经有客户告诉我，CPU与GPU的使用比例正在从过去的1:8演变至1:1甚至4:1（CPU:GPU）。”

我们持续看好CPU行业，仍然维持此前对ARM架构在数据中心份额将持续上升的判断，但也高度看好英特尔和AMD的发展潜力。陈立武本次透露英特尔正依托先进封装技术与晶圆代工产能优势，结合自身的芯片设计能力，正在切入ASIC芯片赛道，可为客户快速定制专属芯片方案。

海外CPU龙头（英特尔、AMD、ARM、高通），国产CPU阵营（海光、长城、禾盛新材）。

事件：Intel CEO 提 CPU 4:1

点评：

1）CPU产业景气持续上行：随着AI从训练转向推理，陈立武指出CPU:GPU 正从 1:8 向 1:1 靠拢甚至可达 4:1。推理时代 CPU 作为系统调度与数据预处理核心不可或缺，算力结构重塑。叠加自主可控加码，国产 CPU 空间广阔，产业景气度确定性上行；

2）海光信息：国内 C86 绝对龙头，2026Q1 营收 40.34亿元、同比增 68.06%，归母净利润 6.87亿元、同比增35.82%，扣除股权同比 +74.86%。是国内唯一获 x86 永久授权 CPU 龙头。海光四号已批量出货，深算4号预计2026H2 推出、性能提升一倍以上；

3）中国长城参股飞腾28.04%。飞腾腾云 S5000C 是飞腾新一代高性能服务器 CPU，相比上一代产品，该产品单核计算性能大幅提升，拥有64/32/16核3种产品形态，兼容 ARMv8 指令集，支持硬件虚拟化，支持 DeepSeek 全系列大模型，主要面向计算、存储、AI服务器等主机服务器和大型互联网数据中心等场景。

华创计算机周楚薇/吴鸣远

巨头联手，加速推进GPU直存（GIDS）发展

据techtimes报道，英伟达和亚马逊正在推进存储架构的研发，该架构允许GPU直接控制SSD等存储设备，有望扩大数十倍“显存”空间；微软与AMD也在同步推进类似方案。

信测标准参股的锋行致远是国内GPU直存龙头

锋行致远自研的存算一体加速模组，容量为1.6TB或3.2TB，该模组将计算能力直接集成于存储设备内部，可在数据存放位置直接执行向量检索、KV缓存、数据过滤等任务，显著减少数据搬运，最高可降低访存成本98%以上。

据报道，英伟达与亚马逊正积极推进新一代存储架构研发，该架构将允许GPU直接操控SSD等存储设备，绕过传统CPU调度环节。英伟达计划率先在其下一代Vera Rubin AI平台上导入“GPU发起直接存储访问”（GIDS）技术。

推动这一架构变革的核心原因，是现有冯·诺依曼架构存在先天性数据搬运短板：所有数据必须经由CPU中转、DRAM缓存，才能传输至GPU。

这直接导致了CPU线程处理能力与GPU数万级并行算力之间的严重错配，该矛盾已成为制约AI推理与训练提速的核心瓶颈。

GIDS技术的突破性在于，它允许GPU直接向SSD或高速闪存发出存储访问指令，全程绕过CPU与DRAM，彻底剔除中间调度层级。

为配合GIDS落地，业界推出高带宽闪存（HBF）以突破HBM的容量瓶颈，延世大学宋基焕教授团队的数据显示，6颗HBF搭配2颗HBM可将GPU存储从192GB拉升至3120GB，容量暴增逾16倍。

需要指出的是，HBF适合AI推理场景中存储基本不变的模型参数，高频率训练场景仍需仰赖HBM。

产业布局方面，多方已同步落子。英伟达主导 GIDS 技术标准，亚马逊优先落地云端算力集群，微软、AMD同步布局自研方案，三星发力Z‑NAND闪存抢占硬件市场。

*公开资料整理，仅作为行业分析参考，不构成任何投资建议！