半导体更新:存储+设备 ①1...
发布者:乐晴
①1月6日,黄仁勋在CES 2026大会讲话上提出“存储必须被重构”。
②美股存储芯片全线暴涨,闪迪收涨27.56%,为十个月以来的最大日内涨幅。美光科技涨10.02%,西部数据涨16.77%,希捷科技涨14%。
③费城半导体指数涨2.75%,创历史新高。
事件:1月6日,黄仁勋在CES 2026大会讲话上提出“存储必须被重构”。
存储瓶颈影响AI推理速度。AI会产生大量上下文数据(KV Cache),传统架构将其放入昂贵且容量有限的GPU内存或者普通存储里(访问太慢)。
NV专门推出新存储层级解决瓶颈问题单GPU可额外获得16T存储容量。
NV推出BlueField-4 与 Context Memory 平台,用 BlueField-4来管理机架内的“KV 缓存上下文内存存储”。
在 Vera Rubin MVLink 72 机架中,每个节点都配备了四个 BlueField-4,每个 DPU 后端接有 150TB 的上下文内存。通过这种设计,每个 GPU 除了自身的 HBM,还能额外获得16TB 的分布式上下文存储。
观点重申:底层硬件变革会带动软件重构GPU-Native数据库到来。架构层面发生变化。从“以CPU为中心”到“以GPU为中心”,数据库软件需要围绕 GPU的数据获取和处理能力重新设计,核心组件层面升级改造。协同提升AI推理效率。GPU-Native数据库先行者星环科技。
风险提示:技术发展不及预期;AI产业发展不及预期。
在本次 CES 上,英伟达首次系统性披露 Inference Context Memory Storage(ICMS 推理上下文内存存储) 架构,在GPU HBM与传统 NVMe SSD之间引入一个面向KV Cache的独立高速存储层,用于承载warm/long context 状态。
该架构通过 NVLink 6 与高性能网络实现上下文的快速调度,本质上将原本高度挤占HBM的 KV Cache 下沉至更具性价比的存储介质。💡Rubin+ICMS的本质#是把AI推理的核心消耗从HBM转移到NAND,或将拉动对于NAND的需求。
弹性测算:Rubin NVL72每个GPU自带1TB存储,存储机柜为每个GPU提供额外16TB,按照1000万颗Rubin GPU测算,则对应NAND增量为153EB,相比全球NAND存储1000EB出货量,增量约为15%。如果ASIC采用类似方案,NAND弹性有望达到30%以上。全球NAND供需缺口或将进一步放大
随着 Rubin 架构推动 KV Cache 系统性下沉,NAND 有望复制 HBM 在训练侧的成长路径,在推理侧打开新的中长期需求曲线。
NAND原厂及模组厂商:
-闪迪、美光
-德明利、佰维存储、江波龙
-铠侠、7709等
方竞/王晔/王海
英伟达确认AI正重塑存储堆栈:过去KV Cache的体积随着大模型发展(Agent、物理世界、推理的需求提升),历史对话的大小和规模线性膨胀,而放在HBM中的经济性和天花板相对较低。
因此Vera Rubin的解决方案是将存储放入机架并用BF4管理,BF4作为DPU外还同时承担KV Cache管理器的角色,通过4个BF4管理和虚化150TB的内存池,每个GPU额外获得16TB的专用空间。
内存语义级的大规模分层存储浪潮:在此情境下DRAM 不再存储全量数据,而是作为 SSD 的高速缓存和元数据管理(Metadata),确保数据能快速从 SSD 搬运到 GPU,也就是我们正经历内存语义级的大规模分层存储的加速变革。
对应eSSD的增量量级有多大?此前GB300 NVL72单机柜存储配置约为553/1106TB,若按照14万机柜算对应155EB的增量 eSSD需求。
观点:英伟达本次发布的全新方案是在架构层面复刻了Intel SCM的分层理念,BF4+DRAM+内存池化是英伟达通过软件定义的SCM,而现有的潜在方案都有各种成本、大规模训练稳定性的问题。从逻辑上看AI正加速一切存储的重要性。
此前市场并未对AI需求下的DRAM和SSD增长逻辑并未形成一致的预期,但在本次发布会后我们认为AI正逐步重塑存储堆栈,而AI服务器市场在当前趋势下对此的需求确定性较高,因此SSD和DRAM或仍有一部分来自应用、推理、Agent化模型的需求超预期,我们持续关注美光、闪迪。
国联民生海外孔蓉/樊程安吉
AI存储墙的两大技术破局路径(融合而非对立)
路径1: 高IOPS直连SSD架构:通过提升SSD的IOPS性能(如英伟达+SK海力士合作AI SSD,IOPS达1亿次),降低GPU数据读取延迟,代表厂商:群联(主控)、铠侠(闪存)。
路径2:HPF/HBF高带宽闪存路径:以高带宽、大容量闪存实现SSD内存化,解决KV Cache容量膨胀问题,代表厂商:SK海力士、闪迪、铠侠。
上述路径2的技术落地的核心瓶颈
1)软件生态:CUDA生态适配、GPU直连数据库的系统级优化难度大
2)硬件稳定性:HPF/HBF闪存与DPU/KV Cache管理器的协同兼容性待验证
202512进展
市场预期:英伟达或与韩国半导体巨头 SK 海力士合作打造全新的“人工智能固态硬盘”(AI SSD)。IOPS或 1 亿次,效能比AI服务器搭载普通企业级 SSD 高出约十倍
NVIDIA的架构升级动作(202601)
1)痛点:KV Cache线性膨胀(QKV算法问题欢迎联系我们)导致HBM成本/容量受限NVLink-C2C、南北向网络方案存在容量/延迟缺陷
2) 解决方案:推出Context Memory Storage Platform,由BlueField-4 DPU管理机架级直连存储,每个GPU扩展16TB存储,适配HPF/HBF闪存与向量数据库
四、相关梳理(不构成投资建议)
1)向量数据库领军(与NV GPU直连适配)
2)存储控制器:英韧科技(一级)、慧荣(SMI)、联芸(高端主控适配AI SSD)
3)存储模组/方案:大普微(一级)、德明利
4)闪存原厂:铠侠、SK海力士、闪迪(AI NAND/HPF需求提升)
事件:NV推出BlueField-4 DPU,使单GPU额外获16TB上下文空间
Vera Rubin NVLink 72每个机架中,配备4个BlueField-4 DPU直接管理150TB的上下文内存池,内存池通过机架内网络与所有GPU直连,为每个GPU分配额外的16TB的专用上下文空间,解决AI应用长上下文的瓶颈。
目前GB300 NVL72单机柜的存储配置为:HBM 20TB、LPDDR5X 17TB、NAND 553/1106TB(取中间值830TB)。
按照10万机柜计算,对应的存储需求为:HBM 2EB 、LPDDR5X 1.7 EB 、SSD 83 EB。
25年全球HBM、DRAM、NAND的供给量是2.8EB、36.4EB、931EB。
根据NV最新在CES的表述,每颗GPU增加16TB NAND,每个机柜增加1152TB NAND。
按照10万机柜计算,NAND需求增加115.2 EB,占25年全球NAND总供给的12%,对NAND的需求极大。
此前仅HBM按照单GPU配比计算,为保存上下文、NV提出每颗GPU配置16TB NAND,对NAND的需求更加确定和可视化,有望成为类HBM的存储产品。
NAND产业链:江波龙、德明利、佰维存储、香农芯创、联芸科技等。
风险提示:需求不及预期等。
26年CES上NV提出AI训练与推理中海量上下文数据的解决方案,随着AI大模型参数扩展到数万亿参数,大量的上下文数据以KV Cache的形式缓存在GPU的存储中,KV Cache占用存储容量的持续变大带来训练和推理的瓶颈。
英伟达借助BlueField-4提供上下文记忆存储平台,在GPU存储和传统存储中构建“第三层”。
NV在Vera Rubin NVL72的每个节点配4个BlueField-4,每个背后有150TB上下文内存,每块GPU额外获得16TB内存。
“第三层”存储池的出现,一方面将提升NVL机柜本身存储的容量,第二是新增了内存池需求,都将增强远期NAND需求逻辑!
看好第二波行情,先前美光业绩印证周期仍在持续,AI泡沫论缓和,我们仍然维持先前路演观点,这轮存储周期看到27年。
1月Q1合约价落地,环比高增,涨幅超预期!后面仍有许多可以期待的催化,关注1月初密集业绩预告,模组厂商均有望取得不错业绩,也关注本周三星业绩。
事件:2026年1月6日CES展上,黄仁勋发表“AI+Robotics+Innovation”主题演讲,下一代Rubin架构已正式迈入量产阶段,预计首批产品将于2026年下半年送达客户。该平台通过顶尖硬件集成与架构创新,再次推高了数据中心算力的上限。
核心观点:Rubin架构重塑“测试墙”,验证逻辑发生范式转移
一、Rubin平台:从算力奇点到测试强度的指数级爆发
物理复杂度登顶:VeraRubin架构采用台积电3nm(N3P)工艺,晶体管数量突破3,000亿大关。根据量测模型,晶体管数量的翻倍将驱动测试数据量或呈3倍以上扩张。
HBM4引发通道资源挤兑:Rubin集成8颗HBM4,单堆栈位宽从1024-bit倍增至2048-bit。测试机数字板卡资源消耗翻倍,导致同测并行度从x4降至x2,产能维持成本或显著推高单台测试机ASP约30%-50%。
热限制下的“冷却周期”:在3nm工艺与超高峰值电流挑战下,热节流系数成为关键变量。全速扫描测试需插入强制冷却周期,预计Rubin总测试时长或将在Blackwell基础上再延长50%。
二、物理AI时代的“全检”逻辑:SLT与老化测试成为刚需
AI走向物理世界(机器人/自驾)对可靠性要求近乎苛刻。Rubin售价数万美元,良率乘积定律极为残酷,测试愈发关键。
测试策略重构:测试重心从单纯的“事后筛选”转向“事前预防”,KGD(已知合格芯片)测试、KG(堆叠晶圆测试)及长达数小时的系统级测试(SLT)成为产线标配
测试相关设备板块已经成为近年来半导体设备收入增速最快的板块之一,龙头爱德万因深度绑定英伟达收入利润快速叠升,看好Rubin带来的全球测试板块市场机遇。国产供应链来说,算力爆发+国产替代,测试设备已从辅助角色走向产业链中心,测试强度的增长将是2026年半导体板块最核心的逻辑主线。
建议关注:
测试机:爱德万、泰瑞达、长川科技、华峰测控、精智达等
分选机/探针台:金海通、矽电股份等
联系人:天风电子李泓依
我们持续关注先进设备链,作为国内半导体扩产最明确需求及国产化率最高的细分,持续为设备公司贡献订单。
25年技术升级导致存储扩产需求弱,基数低;往26年看,先进制程迎来第二成长曲线,未来3-5年国内扩产会持续加速(#设备市场从300亿美元→600亿美元,国产化率30%→60%),国产设备公司未来有3-4倍成长空间,持续加速!
我们看国内先进制程的发展:
萌芽期(22年之前,技术差3代以上)→
追赶期(22~25年,技术差1~2代)→
加速追赶期(26~30年,技术达到先进水平,产能加速追赶)→
引领期(30年以后,技术、产能领先全球)。
2026年开始,我们预计要进入加速追赶期,技术逐渐追上国际先进水平,产能逐渐补全供应缺口,经过我们测算,#未来国内至少需要扩产~80万片存储产能+30万片先进制程产能才能满足国内需求,扩产空间巨大!
怎么研究存储链?
1)最强需求,短期看明年设备公司的存储敞口:
中微公司、精智达、拓荆科技和微导纳米,订单占比均在70%以上
华海清科、中科飞测、珂玛科技、京仪装备、盛美上海等在50%以上
这些公司在本轮存储大扩产中会持续受益。
2)拉长视角,看订单及国产化弹性:
国内先进制程扩产持续加速,国产化率不足30%,5年内扩产需求逐步落地,国产化率加速提升,情绪持续拉升,有望复制2021年设备行情。#要看未来3~5年弹性大的公司,核心关注未来绑定核心客户的以及国产化率弹性高的公司。
绑定大客户看:北方华创、中微公司、拓荆科技、富创精密强者恒强,持续受益;
国产化率看:芯源微、中科飞测、精测电子、珂玛科技。
敞口大+新突破相关梳理(不构成投资建议)
1)中微公司(大客户存储总份额不变,等待订单爆发),芯源微(第四代涂胶显影即将送验证,高端化学清洗加速放量)
2)华海清科(HBM核心供应商)、精测电子(量检测在DRAM持续放量)、北方华创(稳健成长,高端设备突破)
3)珂玛科技(存储陶瓷零部件唯一)、中科飞测(量检测NO.1,高端加速突破)
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!