半导体更新:CPU+GPU直存...
发布者:乐晴
①隔夜费城半导体指数暴涨4.49%,30只成分股中仅一家收跌。
②CPU表现强势,Arm Holdings涨15.05%,AMD涨8.1%,英特尔涨7.36%。
③英特尔CEO陈立武最新表态:CPU与GPU比例向4:1演进。
④英伟达Vera Rubin或联合AWS推GPU直存(GIDS),GPU直控SSD有望为堆叠NAND的HBF打开大门。
5月20日,INTEL在摩根大通全球科技会议上明确指出,AI推理负载正推动算力架构发生根本性重构,CPU与GPU的使用比例已从此前行业默认的1:8向1:1甚至4:1演进。
陈立武特别强调,这一判断来自与多家前沿模型公司和AI创业企业的深度交流——强化学习与多智能体编排等工作负载,使得CPU在端到端推理链路中的角色正从辅助转向核心。
AI推理时代、CPU将成价值锚点,ARM中期弹性更大。
Agent工作负载的碎片化调用与长链路编排特性,决定了CPU耗时占比可达端到端延迟的40%至90%,GPU的单卡算力优势在此场景下不再是唯一变量。相较于推理侧GPU,CPU的需求弹性远被低估。中期维度看,ARM架构凭借能效比与可扩展性优势,在云原生推理场景中的渗透斜率将更为陡峭,产业变局深度值得重视。
涨价潮已至,Intel与AMD提价,国产CPU有望批量供货CSP。
过去四个月,两家巨头库存持续趋紧并启动多轮提价,验证了我们报告中“CPU再涨价趋势确立”的预判。国内方面,国产CPU逐步突破CSP供应链壁垒,自主可控进程与需求周期形成共振。
重申看好CPU赛道
风险提示:AI推理需求落地节奏不及预期;国产替代进程存在不确定性;下游CSP资本开支或出现阶段性波动。
在摩根大通第54届全球科技、媒体与通信会议上,英特尔CEO陈立武表示CPU在AI算力中的配比格局正在发生根本性变化。
陈立武透露,自己与多家前沿模型公司和AI创企进行了深入交流。这些企业传递了一个明确信号:CPU的价值被低估。“即使在单线程场景下,CPU也展现出强大的实用性。更关键的是,在强化学习、多智能体编排以及工作负载优化等环节,CPU的作用越发重要。”
陈立武判断,Agentic AI正在重新定义算力需求结构。推理阶段与训练阶段存在本质差异:推理更依赖CPU的串行处理能力、实时响应能力和能效表现。“已经有客户告诉我,CPU与GPU的使用比例正在从过去的1:8演变至1:1甚至4:1(CPU:GPU)。”
我们持续看好CPU行业,仍然维持此前对ARM架构在数据中心份额将持续上升的判断,但也高度看好英特尔和AMD的发展潜力。陈立武本次透露英特尔正依托先进封装技术与晶圆代工产能优势,结合自身的芯片设计能力,正在切入ASIC芯片赛道,可为客户快速定制专属芯片方案。
海外CPU龙头(英特尔、AMD、ARM、高通),国产CPU阵营(海光、长城、禾盛新材)。
事件:Intel CEO 提 CPU 4:1
点评:
1)CPU产业景气持续上行: 随着AI从训练转向推理,陈立武指出CPU:GPU 正从 1:8 向 1:1 靠拢甚至可达 4:1。推理时代 CPU 作为系统调度与数据预处理核心不可或缺,算力结构重塑。叠加自主可控加码,国产 CPU 空间广阔,产业景气度确定性上行;
2)海光信息:国内 C86 绝对龙头,2026Q1 营收 40.34亿元、同比增 68.06%,归母净利润 6.87亿元、同比增35.82%,扣除股权同比 +74.86%。是国内唯一获 x86 永久授权 CPU 龙头。海光四号已批量出货,深算4号预计2026H2 推出、性能提升一倍以上;
3)中国长城参股飞腾28.04%。飞腾腾云 S5000C 是飞腾新一代高性能服务器 CPU,相比上一代产品,该产品单核计算性能大幅提升,拥有64/32/16核3种产品形态,兼容 ARMv8 指令集,支持硬件虚拟化,支持 DeepSeek 全系列大模型,主要面向计算、存储、AI服务器等主机服务器和大型互联网数据中心等场景。
华创计算机 周楚薇/吴鸣远
巨头联手,加速推进GPU直存(GIDS)发展
据techtimes报道,英伟达和亚马逊正在推进存储架构的研发,该架构允许GPU直接控制SSD等存储设备,有望扩大数十倍“显存”空间;微软与AMD也在同步推进类似方案。
信测标准参股的锋行致远是国内GPU直存龙头
锋行致远自研的存算一体加速模组,容量为1.6TB或3.2TB,该模组将计算能力直接集成于存储设备内部,可在数据存放位置直接执行向量检索、KV缓存、数据过滤等任务,显著减少数据搬运,最高可降低访存成本98%以上。
据报道,英伟达与亚马逊正积极推进新一代存储架构研发,该架构将允许GPU直接操控SSD等存储设备,绕过传统CPU调度环节。英伟达计划率先在其下一代Vera Rubin AI平台上导入“GPU发起直接存储访问”(GIDS)技术。
推动这一架构变革的核心原因,是现有冯·诺依曼架构存在先天性数据搬运短板:所有数据必须经由CPU中转、DRAM缓存,才能传输至GPU。
这直接导致了CPU线程处理能力与GPU数万级并行算力之间的严重错配,该矛盾已成为制约AI推理与训练提速的核心瓶颈。
GIDS技术的突破性在于,它允许GPU直接向SSD或高速闪存发出存储访问指令,全程绕过CPU与DRAM,彻底剔除中间调度层级。
为配合GIDS落地,业界推出高带宽闪存(HBF)以突破HBM的容量瓶颈,延世大学宋基焕教授团队的数据显示,6颗HBF搭配2颗HBM可将GPU存储从192GB拉升至3120GB,容量暴增逾16倍。
需要指出的是,HBF适合AI推理场景中存储基本不变的模型参数,高频率训练场景仍需仰赖HBM。
产业布局方面,多方已同步落子。英伟达主导 GIDS 技术标准,亚马逊优先落地云端算力集群,微软、AMD同步布局自研方案,三星发力Z‑NAND闪存抢占硬件市场。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!