AI算力链+GTC大会更新 ...
发布者:乐晴
①黄仁勋在GTC演讲中提出英伟达旗舰算力芯片有望到2027年带来1万亿美元营收。
②演讲中展示了Vera Rubin AI工厂平台、LPU推理架构、CPO交换机与太空数据中心模块,并推出NemoClaw智能体基础设施,构建从边缘、数据中心到轨道计算的全栈AI生态。
③英伟达收盘涨1.65%。
④Meta计划在未来五年内,向人工智能公司Nebius投入高达270亿美元的资金。
⑤日本三井金属拟调涨半导体极薄铜箔价格。
- AI芯片市场展望视频( )
-太空数据中心说明视频( )
- OpenClaw项目介绍视频( )
AI服务器核心基建变革
本届GTC大会主旨演讲聚焦AI算力基建痛点,官宣AI服务器整机架构、供电、散热代际升级,敲定新一代高功耗算力芯片配套底层技术核心方向:
1)AI服务器架构迭代变化。
发布Vera Rubin全新AI平台,重构AI服务器整机架构,核心机型NVL72搭载第六代NVLink高速互联技术,算力与互联效率大幅跃升;对比前代平台,大模型单Token推理成本降至原先1/10,能效比、算力密度实现代际突破,适配万卡级AI工厂规模化部署。
2)液冷散热技术升级。
明确风冷散热瓶颈,官宣Vera Rubin平台、NVL72机架全液冷标配,液冷正式成为新一代AI服务器必选方案;创新采用45℃温水冷却技术,舍弃高能耗制冷压缩机,兼顾散热效率与数据中心能耗优化,破解高功耗芯片散热难题。
3)AI服务器电源、超容与HVDC高压直流。
Vera Rubin 平台要求其对 AI 供电方式进行根本性重新思考。NV正将800V 高压直流(HVDC)作为所有AI工厂的标准。这不仅是升级——而是彻底转型,相比传统54V系统,它能以45%更少的铜材和40%更低的电力损耗提供单机柜250kW功率。结合全液冷技术,800V HVDC是将AI计算扩展到未来十年所需兆瓦级水平的唯一途径。
Vera Rubin NVL72系统采用四个110kW电源架,配置为N+1冗余——每个电源架高3U,集成六个18.3kW电源模块并内置储能电容。
Vera Rubin NVL72引入智能功率平滑技术——机架级储能增加6倍(每GPU400焦耳),并配备闭环系统,使GPU能够持续监控电容充电状态。这能平滑功率曲线,将峰值电流需求降低高达25%,并消除了对大型电池组的需求以应对大瞬态变化。
4)太空算力
推出NVIDIA太空计算平台,这是一个将AI带入轨道的完整平台,包含三个核心产品:Space-1 Vera Rubin模块、IGX Thor和Jetson Orin。Space-1在太空AI推理性能上比当前基于H100的系统高出25倍,支持实时地理空间智能和自主太空操作。
太空中没有对流,没有传导——只有辐射散热。Space-1 Vera Rubin模块采用针对太空真空环境优化的被动冷却设计,配备热辐射系统,散热能力达40W/cm²。此设计使其能够在轨道上部署数据中心级AI计算,无需庞大的主动冷却系统。
不只是把GPU送入太空——NV正在建造太空数据中心。Space-1连接到NVIDIA Earth-3D云平台,创建从轨道边缘→地面AI工厂→云端分析的无缝计算连续体。这将彻底改变卫星图像处理,通过在轨AI推理将数据下行链路需求减少90%。
孙潇雅/高鑫/吴佩琳
GTC2026重磅落地:Dynamo拆分推理架构发布:LPU定义推理硬件新方向
英伟达GTC2026演讲重磅敲定Dynamo拆分推理架构,正式落地Groq LPU专用推理硬件,直击高实时、高吞吐推理场景的核心痛点。
架构采用确定性数据流设计+海量SRAM片上存储,精准拆分推理全流程:1)Vera Rubin负责prefill预填充与注意力计算 2)Groq LPU专注decode解码生成。
二者通过专用以太网模式实现高效耦合;LPU凭借低时延、高能效特性完美适配实时AI场景,即便单颗容量有限需多芯片集群部署,仍成为英伟达推理产品线的核心增量,全面推动AI推理硬件向专用化、高效化方向迭代。
架构革新驱动需求扩容:LPU三大逻辑推升PCB与高频材料用量
LPU异构协同架构直接打开PCB产业链增量空间,核心源于三点刚性需求:
高密度集群部署:LPU单体算力容量有限,大模型场景下需大量芯片堆叠,直接拉高单套系统PCB搭载量;
分阶段协同互联:GPU与LPU分工处理、多LPU组网通信,倒逼高等级PCB保障低延迟、高信号完整性传输;
高端材料升级:高速互联要求推动PCB基材向M9等级进阶,核心骨架材料Q布消耗量倍数增长,带动覆铜板产业链量价齐升。
LPU产业催化持续释放:核心PCB迎3-5年成长确定性与估值重塑
从长期资产视角看,LPU架构迭代将为PCB行业打开长周期成长空间,可穿透3-5年看业绩确定性。当前主流PCB公司估值约10倍,处于历史低位,在AI推理硬件放量与高频高速需求驱动下,行业估值与成长空间有望显著修复,是逢低布局的优质时点,我们坚定看好全产业链。
相关:胜宏科技、生益科技、景旺电子、深南电路、沪电股份、世运电路、东山精密、鹏鼎控股、鼎泰高科、菲利华、中材科技。
天风电子团队 冯浩凡
M10情况
1) 定位&节奏:NV下一代产品Feynman,预计最快27H2量产,目前处于早期材料测试和评估阶段。
2) CCL:国内NY2个月前送样至NV,TG原定26Q4送样现提前至5-6月,其他SY、DS也同步被要求提前送样。
3) 材料:铜仍是4代(核心原因5代铜无合规供应商),采用二代Q布(纯度5个9,一代是4个9,预计价值量翻倍),碳氢和PPO树脂升级性能指标。
涨价情况
1)布:涨价趋势明显,目前按月谈价。
2) 铜:已同意三井4月全系涨价2美金/kg(1.4万/吨,预计涨幅10%-15%,看产品),预计26Q3、26Q4仍有涨价,涨幅均在2-3美金/kg,即累计有望较目前涨30%+。
3) CCL:头部厂商25年仅调整了M6及以下涨价,预计4月启动M6以上涨价,涨幅10-15%。
PCB上游材料持续演绎产品迭代&涨价逻辑。
涨价线:铜涨价态势超预期,核心铜冠,其次德福、中一、嘉元、诺德。此外,PCB产能陆续释放,铜粉进一步紧张,江南新材。
迭代线:到M10 Q布、树脂价值量提升明显,核心菲利华、东材。
孙潇雅/张童童
M10材料近期讨论度较高,我们组织专家交流:
1)M10定义及相关进展
-当前M9材料要求df约0.0007-0.0009,M9+/M10尚无非常确切定义,基本认为df<0.0005;
-当前处于送样早期,一阶段主要针对电性能进行测试,完成后二阶段针对可加工性、热膨胀系数等稳定性方面做改进,同时PP材料也需作出较大改进,预计28年左右方案落地
-供应商方面,台光、生益、南亚等头部厂商均有送测CCL,处于电性能测试环节;PP膜材方面生益、松下、伊帕思等储备较深
2)上游材料体系
树脂:
-树脂为决定CCL性能最核心的环节,M10主要采用三种体系:1)碳氢,2)PTFE,3)BT树脂+碳氢,当前以碳氢作为主攻方案
-碳氢体系较为成熟,在M9(BCB树脂掺杂50%左右)基础上掺杂更多BCB树脂提高介电性能(M10BCB树脂掺杂60-70%);
-PTFE体系介电性能好,但可加工性较差;BT树脂+碳氢体系中掺杂BT以提升耐热性,改善热膨胀系数,处于早期阶段
-国内供应商方面,东材为BCB树脂核心供应商
电子布:
-有Q布及low-dk三代布两种方案,Q布成熟度更好,为首选方案,但较难加工;三代布尚未成熟,加工性更友好。国内供应商方面,Q布方面菲利华、宏和、中材等;low-dk三代布包括宏和、中材等
铜箔:-HVLP4及HVLP5均在测试,主要配合树脂体系,若树脂配方介电常数优异,可选择HVLP4而不必升级5.国内供应商方面,铜冠、德福、隆扬在送测。其他:除了主体树脂外,还需要掺杂小分子树脂材料以改善热稳定性,此外球硅尺寸要求更小,用量更多。我们认为M10仍处于一阶段电性能测试环节,距离落地尚有时间,但仍为值得关注的未来CCL重要升级方向,建议关注PCB环节掌握高速CCL加工能力的 胜宏、沪电 等头部厂商,以及生益、南亚 等核心CCL厂商;上游方面重点关注增量最大的BCB树脂核心供应商东材科技。
英伟达GTC大会上,黄仁勋正式发布全球首款量产级 Spectrum-X #CPO硅光交换机,标志着#电子直接转光子正式迈入商用化时代。我们认为,这不是简单的网络升级,而是算力基础设施底层架构的代际跃迁,光互联投资逻辑正被彻底重塑。
1)技术革命:从”光模块时代”跨入”硅片光化时代”
-传统架构下电信号经PCB走线再进光模块完成光电转换,延迟与功耗随算力规模指数级膨胀。英伟达联合台积电开发CoUP封装工艺,实现光学器件与交换芯片的3D共封装,信号在硅片表面即完成电转光,彻底省去传统光模块和铜线中转环节。
-性能数据极为惊艳:能效提升3.5倍,信号完整性提升63倍,系统可靠性提升10倍。面对GB200系统72块GPU实现260TB/s全对全带宽的刚需,传统铜缆已触及物理极限,CPO凭借光子低损耗特性彻底打破机架空间瓶颈。
2)产业重构:供应链向硅光、封装、检测全面倾斜
英伟达目前是全球唯一实现CPO方案量产的厂商,Yole预计到2030年CPO市场规模达81亿美元,CAGR高达137%。光互联不再是外设插件,而是算力芯片效率的核心组成。CPO爆发将倒逼产业链向硅光芯片、高精度封装及晶圆检测设备端快速倾斜。
三条主线梳理,不构成投资建议:
-光模块龙头:新易盛、中际旭创;
-硅光核心上游:仕佳光子 (CW DFB激光器芯片+AWG+MT-FA全产品线卡位)
- 封装设备与新材料:罗博特科、燕麦科技 (收购AXIS-TEC切入硅光晶圆检测,填补量产检测空白)
光入柜内-- Rubin Ultra用CPO进行拓展,Feynman CPO在柜内使用。黄仁勋Keynote 演讲中明确提出,Oberon NVL72系统始终保持向后兼容,柜内铜线但是#可以进行光学拓展至NVL576,如Rubin Ultra通过 Spectrum6 CPO交换机将8个机柜连接组成576的超节点。同时在Roadmap中Feynman的Switch Tray搭载 NVLink 8 CPO交换芯片,#这意味着Feynman的柜内中将首次大规模使用光学技术,光入柜内产业趋势被加强。
光连X--LPU及存储池的连接均需用到光互联。在NV展台中,展示了Groq 3 LPX机柜(LPU)及MGX机柜(存储),在一个大的集群中,GPU将与存储机柜、LPU机柜链接,现场调研确认,由于连接距离较长,LPU及存储机柜与GPU机柜的连接均需要用到光学互联,#其机柜内部均有明显的OSFP光学接口供客户自行决定采用可插拔还是CPO方案。LPU及存储池的的光学连接是光互联场景的又一延伸,打开增量空间。
GTC展台展示了3台面向Scale Out的CPO交换机,分别为以太网Spectrum-X系列的SN6800(512ports 409.6Tb/s,4颗交换芯片)及Spectrum-X SN6810(128ports 102.4Tb/s,1颗交换芯片),以及IB网络 Quantum-X 系列的 Q3450(去年展台也有展出)。Spectrum-X系列交换芯片单颗带宽为102.4Tb/s,搭载32颗3.2T颗OE光引擎,并未展示Scale Up相关CPO产品。相关产品细节及配比关系欢迎私信。
核心结论:“光入柜内”势在必行打开一个3-5x的纯增量市场,“光连X(存储、LPU 等等)”的技术趋势同样值得重视,这些逻辑在GTC 2026进一步被强化,重视光学在网络中的全面渗透。推荐标的:“光入柜内”核心标的 中际旭创/新易盛/天孚通信/源杰科技
风险提示:产业发展不及预期
黄仁勋GTC主题演讲要点总结
1)从芯片公司到1万亿美元“代币工厂”,推理时代的经济重构。黄仁勋宣布计算需求进入“百万倍增长”阶段,将今后至2027年这段时期的算力需求预测由5000亿美元翻倍至1万亿美元。他定义了“代币工厂”概念,指出未来的数据中心将不再是存储中心,而是生产智能代币的工厂。英伟达icon强调,通过极端的“协同设计”,其单位代币成本已达到世界一流且无可撼动的水平,迫使全球CEO必须像管理资产一样管理“代币产出率”。
2)Vera Rubin架构与Groq融合,解耦推理开启350倍加速。演讲揭晓了代号为Vera Rubin的下一代架构。该系统采用全液冷设计,引入了针对智能体任务优化的Vera CPU。最重磅的突破在于整合了Groq团队的确定性流处理器技术,通过Dynamo软件 实现了“解耦推理”:利用Rubin的海量内存处理复杂上下文,利用Groq芯片极速生成代币。这一组合使吉瓦级工厂的代币生成速度实现了惊人的350倍跨越。
3)OpenClaw:AI时代的“Linux 时刻”与智能体操作系统。黄仁勋将开源项目OpenClaw定义为AI时代的Linux。这是一个能让AI智能体自主调用工具、执行代码、管理文件系统的操作系统级框架。为解决企业安全痛点,英伟达推出了NeMo Claw参考设计,集成 OpenShell 隐私护栏,标志着软件产业icon正从SaaS向AaaS 全面转型。
4)物理AI的“ChatGPT时刻”:从自动驾驶到迪士尼雪宝。演讲展示了物理AI的爆发,宣布自动驾驶已进入大规模商用阶段。NVIDIAicon RoboTaxi Ready平台新增比亚迪icon、现代、吉利等合作伙伴,覆盖每年1800万辆新车,并与Ubericon达成部署协议。高潮部分是迪士尼机器人Olaf现身,展示了通过Omniverse和Newton求解器在虚拟世界中进化出的物理适应能力。
5)Feynman架构与太空布局:垂直整合走向星辰大海。展望未来,黄仁勋披露了继Rubin之后的下一代GPU架构Feynman,将搭载LP 40处理器和Rosa CPU,支持共封装光学技术。此外,英伟达宣布进军太空计算,研发Vera Rubin Space-1计算机。通过Omniverse DSX平台,该公司正在构建一个“数字孪生”的全球(甚至太空)设计体系,实现从硬件层到宇宙级基础设施的垂直整合。
当前大模型仍处于Free阶段,后续往Ultra阶段发展
NV根据单个用户每秒能获得的Tokens(TPS/User)将对应的大模型分为不同的价格档位
Free:~50TPS/User,对应Qwen 3(2350 亿参数,32K 上下文),价格为$0/百万Tokens
Medium:~100TPS/User,对应Kimi K2.5(1 万亿参数,128K 上下文),价格为$3/百万Tokens
High:~200TPS/User,对应GPT MoE(2 万亿参数,128K 上下文),价格为$6/百万Tokens
Premium:~400TPS/User,对应GPT MoE(2 万亿参数,400K 上下文),价格为$45/百万Tokens
Ultra:~800TPS/User,对应GPT MoE(2 万亿参数,400K 上下文),价格为$150/百万Tokens
NVLink可满足Free-High阶段的吞吐量需求,Groq延伸需求能力至Premium-Ultra阶段
当大模型处于Free、Medium、High阶段时,重要的在于吞吐量,NVLink可提供更高的吞吐量;进入Premium阶段,Vera Rubin相较于Blackwell可提高10倍吞吐量,当加入Groq的能力时,相较于Blackwell可提供35倍吞吐量;进入Premium阶段,NVLink受限于带宽,无法提供更高的吞吐量,收购Groq可让NV为Premium、Ultra阶段的大模型提供服务。
新一代Groq LPUv3升级SRAM与内存带宽,与Rubin呈互补作用
相较于Groq第一代LPU,LPUv3将SRAM从230MB提高到500MB,将内存带宽从80TB/s升级到150TB/s,代工厂为三星;Rubin可提供288GB HBM4,与LPUv3呈互补作用。NV重新设计推理的执行方式,将两个极大的处理器整合在一起,一个用于高吞吐量,一个用于低延迟,并将解码生成、低延迟、带宽受限的工作负载分配给LPU。
推出Groq 3 LPX,预计26Q3发货
2026GTC大会上,NV推出Groq 3 LPX机柜,Groq 3 LPX内置8颗Groq Chip(LPU 3),可提供128GB SRAM和40PB/s的Memory Bandwidth,目前已经量产,与Rubin机柜以以太网的形式链接,预计26Q3发货。
我们认为LPU受益于低推理延时的优异表现,有望实现快速渗透,我们看好LPU的高成长性及LPU以机柜出货时带来的PCB机会。相关:智微智能(参股元川微)、星宸科技(多轮增资元川微 )、沪电股份(英伟达PCB供应商)、胜宏科技(英伟达PCB供应商)、深南电路。
1)Groq 3(LPU芯片):预计26Q3发货。
LPX机架:单机架256个LPU,置于Vera Rubin机架旁,Groq LPX可以将其Rubin GPU的每瓦Token处理性能提升35x;其中GPU用于高吞吐,LPU用于低延迟。
- 128GB SRAM;40PB/s 带宽;315 PFlop算力(FP8下);256颗芯片;scale-up带宽:640TB/s。
2)黄仁勋称“到2027年将看到至少1万亿美元的高确信度需求”。他提出“Token工厂经济学”,强调每瓦性能是商业变现的核心。黄仁勋断言Agent(智能体)将终结传统SaaS模式,未来“年薪+Token预算”将成为职场新标配。宣告推理时代到来。
3)推理端算力有望跟随用户一些指数级增长,推理端的核心是LPU。LPU带来M9和Q布的新放量,Q布爆发将大幅增厚电子布板块的收入和利润。Q布用52层,层数通胀1倍+;Q布的织布速度只有7628布的1/4,同样的布需要4倍织布机,织布机需求拉爆。Q布爆发加剧电子布织布机短缺,整个电子布进一步价格上涨。
相关梳理,不构成投资建议:
菲利华(Q布性能第一,目前各大厂的主力供应商)
中国巨石(台光扶持巨石,巨石已有专门的Q布产线,测试进展顺利,今年6月会成为台光正式Q布供应商并获取较大份额;目前电子布价格可以看到2026年近70亿元利润,仅14倍PE)其他:宏和科技/中材科技/国际复材等
1)我们先前已多次强调看好铜互联(Cable)方向,本次GTC信息进一步验证“系统不会押注单一路线”,铜与光按距离/功耗/成本/交付确定性进行组合配置,铜缆在短距互联中仍是关键选项。NVIDIA明确表态“copper仍然重要”“光学纵向扩展会采用”“横向扩展会采用光学”,结论是“两者都是Nvidia所需要的能力”,并且Feyman系列产品依然两者兼具。
2)铜互联覆盖Nvidia全系列产品
Rubin Vera:Oberon(NVLink 72、Nvlink 576)、Oberon(ETL 256 groq系列产品)
Rubin ultra:Oberon NVLink 72、Kyber NVlink 144
Feynman(下一代GPU平台):Oberon NVL72、Oberon ETL 256和Kyber 144/1152
3)看好国内铜互联公司长期低估→预期修复的弹性
过去市场用“光替代”单线叙事压制铜的定价,GTC确认铜与光为组合路线,平台级机柜明确配置铜方案后,我们认为国内铜缆/连接产业链具备修复弹性。相关:立讯精密,以及鸿腾精密、沃尔核材、金信诺、新亚电子、泓淋电力、精达股份、鼎通科技等铜互连产业链公司。
从黄仁勋的演讲中,展示的Vera Rubin NVL72机柜中,我们注意到powershelf的数量为4组。在我们之前的预期中:GB200:一个shelf 33KW,单个PSU 5.5KW ,用6-8组。GB300:一个shelf 33KW,单个PSU 5.5KW ,普遍用8组。VR200:一个shelf 110KW,单个PSU 18.5KW ,之前预期用3组 。#现在展示的图片用8组。那也就意味着,单个NVL72机柜在VR200时代,功率增加67%(现在110*4,之前33*8),考虑到电源功率密度的增加,保守预估单个Vera Rubin NVL72机柜电源价值量相较于GB300提升70%以上。
Rubin预计将于今年下半年开始交付,老黄看到了未来一万亿的需求,需求覆盖到了27年。
GTC很多东西都在预期之内,之前也提前挖掘过的了:
Rubin的架构内,机柜内会出现576节点,在这个576节点会有CPO方案,也会应用上CPO技术(8机柜互联),铜方案也会保持(应用到铜的极限)。主要看台积电的量产CPO能力了,已与台积电全面量产用于Spectrum X芯片的共封装光学芯片。到了Feynman这一代, 明确了Feynman采用3D堆叠, 但是并不是堆叠Groq LPU, 而更大程度是在堆叠定制的HBM. 然后这一代的LPU会从LPU C2C切换到NVLink, 同时值得一提的是这一代会全面支持CPO机柜外和机柜内。
展示出了正交背板在Rubin ultra中的应用,同时Rubin系统采用100%液冷设计,使用45°C的温水进行冷却,彻底移除了传统繁杂的缆线。
然后是LPU,同样的功耗下Rubin + Groq 3 LPX还可以相对Rubin提升1倍的能效,每兆瓦功耗的推理吞吐量最高可提升35倍,万亿参数模型的收益机会最高可提升10倍。
也点名了存储,原来的Rubin CPX的方案似乎被取消了,大概率是存储涨太贵了,也推出来了定制化存储,英伟达重新设计了整个存储系统:BlueField - 4 STX 存储机架。可将 GPU 内存无缝扩展到整个数据中心。
而且最后太空计算也来了,会考虑发布适合太空辐射的Rubin芯片。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!