返回话题列表
乐晴行业观察
2026/03/01 21:43
类型 talk 14阅读 1

AI链更新:GTC+DeepS...

发布者:乐晴

①2026 GTC将于3月16日召开,英伟达计划推出新芯片重塑计算市场。

②DeepSeek将发布期待已久的人工智能模型,对美国竞争对手发起新挑战。

③美国在中东的打击行动使用了Anthropic技术。

1)LPU,有16x 或 32x per compute tray, 或256x per rack的版本, 具体端侧chat还是云侧长上下文推理应用未定,目前仅有demo,将来应该会更加集成到gpu附近,例如gou/lpu + 3d sram + hbm (+hbf?),这里散热和对gpu主频的影响值得关注;目标2028年量产;

2) 独占tsmc 1.6nm工艺资源的Feynman。同时,25%的Feynman例如IO die,EMIB packaging计划给Intel做。注: gpu原来的架构里就有sram和hbm,lpddr,所以这次feynman的主要设计演进貌似主要是?tsmc的3D堆叠@1.6nm?+?groq的软件cache集成到CUDA。集成groq的lpu理念到nvda体系架构应该是最关键的布局,可以解决之前提到的到底先优化5%还是95%的负载的问题, 1里提到的问题;

3)VR200 NVL72平台带HBM4;

4) 2027年scale-up cpo,2026年先走scale-out给spectrumx和infiniband;

5)NVL576带448G serdes,中板使用PTFE base和Q-glass M9材料;

6)Vera 做为唯一支持LPDDR5的数据中心用于post-train的CPU,以减少Amdahl‘s Law单线程的性能影响;

7)(GPU+Stacked Memory),有几种方案,以缓和内存的瓶颈问题。这里可以衍生成多节点设计,即对接到storage expansion disaggregation的设计,进一步缓解kv cache的问题;

8)展出(更真实的)正交背板;12月底是第一阶段先下单CCL需一个月,1月后PCB再需两个月至3月,然后第三阶段众多测试再需三个月;所以,应该是2026年中完成;

9)BF5,NVL8,QC,等;

10)软件,应用(Physical AI,Robotics,Digital Twin, 垂直领域等),生态,合作等不赘述。

根据目前释放的信息,本次GTC2026大会上,英伟达将重点展示Rubin和Feynman两代新产品。对应电源方面,除了去年讨论度很高的HVDC、SST等800V架构技术外,我们认为三次电源将会是最有机会超预期的方向之一。

传统的芯片,数据线和电源线都在芯片正面争抢空间。随着Rubin芯片越来越大、晶体管越来越密,“抢道”导致电阻增加,发热严重,布局方式严重受限。垂直供电的核心目的是为了缩短电流跑的距离,减少损耗,同时节省有限的主板空间。

事实上目前除了NV在用分立方案外,其他芯片都已是垂直供电模块,有的模块放在背面,有的模块放在正面,但对PCB的要求是类似的,都要做预埋电感或电容方案,即在PCB的压合过程中,直接将电感或电容元件埋入PCB内部,技术难度更高,较普通的电源PCB价值量高数倍。

未来到Feynman架构,三次电源还有可能要做成IVR设计,就是将电源模块直接集成进GPU封装内部甚至Die上的技术,对PCB要求进一步提升。相关:中富电路、麦格米特、欧陆通,以及科士达、新雷能、铂科新材、威尔高。

风险提示:新技术不及预期。

Token经济时代,推理算力迎来四大趋势:

推理算力需求爆发,春节期间国内头部大模型推理数据大幅增长,openrouter中国AI模型调用量首次超美且持续崇高。

纯推理芯片成新贵,未来形成训练用GPU-HBM、推理用ASIC+LPU-SRAM+SSD组合的格局。

推理系统全方位革新:适配Agent需求,CPU需求增加。

国产算力芯片加速突破,华为昇腾950首款推理芯片26Q1推出、盛合晶威2.5D封装业务收入快速增长。

我们期待的DeepSeekV4?

强推理和代码+长上下文+Agent+国产算力适配。技术支撑:Engram和DualPath论文,存算解耦+异步掩盖+带宽倍增,工程优化提高网络利用率、降低高性能显存依赖。

需求的爆发已经是共识,推理时代也是国产芯片的黄金时代,CSP的下单仍将继续

另外两个重要的趋势:

1)纯推理芯片的崛起

不一定是ASIC,也可以是GPGPU,但一定越来越专用,核心的指标是TDP(TFLOPS/Watt)、吞吐,而不是原来的算力、显存、带宽。

本周热议的英伟达Feyamann架构融合Groq LPU-SRAM,OpenAI与Cerebras的合作,字节自研ASIC、PPU,都在印证这一趋势。

值得注意,SRAM速度虽快,但容量有限、综合成本更高,不会完全取代DRAM/HBM,但会作为极低延迟、高确定性推理算力的补充。

对于国产芯片厂商来说,纯推理芯片不需要最高规格的工艺,卡脖子程度缓解,但需要深刻理解应用场景,目前需求主要来自AI云,深度配合云业务的芯片有优势。

2)推理系统革新,PD分离、网卡、新的存储方案、CPU

在过往,chatbot类应用对于LLM的要求是“像输送水管一样快速吐字”,转向Agent后,应用对大模型的要求是“像数学家一样反复推演”。

应对这种需求,推理算力系统设计上,可能形成类人的三层网络

第一层是快反应层,类似人的脊髓、反射弧,由纯推理芯片来提供极致低延迟的反馈

第二层是慢思考层,类似人的大脑皮层,使用超大吞吐的算力集群负责后台并行的复杂逻辑推演和工具使用。

在这一层中,CPU也会加入进来,线程、用户数、调度的需求多了,数据的编排和程序的控制会更多,对多核多线程的CPU需求增加。但仍需要与GPU协同发挥作用。

第三层是记忆层,类似人的海马体,存储Agent的终身记忆和KV Cache,英伟达发布的ContextMemory System,在算力系统中加入通过DPU管理的SSD是一种方式,后续可能还有更多的方案出现。

申万计算机曹峥/黄忠煌

【财务表现】2025年总收入4.56亿美金(同比+83%),其中数据中心 1.96 亿美元(同比+ 32%);CATV 收入2.45亿美金(同比+179%)。Q4单季度收入1.343亿美元(环比+13%,同比+34%,接近指引1.25-1.4亿美金上限),GAAP毛利率31.2%(高于指引29-31%上限)。

【Q4季度分业务表现】:数据中心业务:数据中心产品 7490万美元(同比+69%,环比+70%),其中100G 产品同比+54%,400G 产品同比+141%。CATV业务:收入 5400 万美元,同比+3%,环比-24%,符合此前交付波动预期。电信业务:收入 510 万美元,同比增+45%,环比+ 37%,符合预期波动。

【数据中心业务】北美云厂需求强劲,800G光模块进入放量期。美国本土制造优势驱动获单能力,2025年底800G光模块月产能达10万只,美国工厂产能占比达31%。台湾工厂已于2025 年通过该超大规模客户多款 800G 产品的生产认证,同时德州工厂预计年中完成全部认证。预计26年底,800G/1.6T总月产能有望超过 50 万只。公司具备自研激光器能力,关键组件主要在美国制造,中国组件价值不足10%。未来随着德州工厂持续扩产,美国本土制造占比有望进一步增长,27年底预计55%产品将在美国本土生产。

【客户情况】Digicomm和Microsoft分别贡献了公司2025年收入53.1%和28.8%。数据中心方面,公司本季度已获得云厂重点客户第四批800G订单,Q2开始大规模放量。同时,公司已受到另一家客户反馈即将订购800G产品;第三家客户未来几周也预计将进行800G+1.6T产品认证。

【业务指引超预期】预计Q1收入1.50 亿–1.65 亿美元(中值1.58亿美元,同比+58%,环比+17%),全年收入将超过10亿美元,非 GAAP 营业利润超1.2 亿美元。扩大制造产能方面进展顺利,德州休斯顿、台湾、宁波三地工厂同步扩产,德州工厂投资超过3亿美元,预计将扩产三倍已匹配需求爆发。到2027年中100G/400G月度收入约9000万美元,800G 月度收入约 2.17 亿美元,1.6T月度收入约 7100万美元,光模块产品月光模块产品月度总收入3.78亿美元(#年化产值达45亿同比增长5倍以上)。随着产品结构优化,预计27Q4光模块整体毛利率有望超过40%。

公司2025年营业收入64.97亿元,归母净利润为20.59亿元。其中,2025Q4单季度实现营业收入18.9亿元,环比增长8.6%。

我们认为:2025Q4收入保持环比增长,证明了下游需求的可持续性,随着新产品和新互联技术的加速落地,公司有望实现弹性较大、确定性较高的增长。

郑宏达/谢忱/李想/卢可欣

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!