AI+端侧+光模块更新 1、...
发布者:乐晴
周一,英伟达创始人兼CEO黄仁勋出席台北国际电脑展并发表首场主题演讲,总结如下:
GraceBlackwell已全面投入生产。基于HGX主板的Blackwell系统去年已全面投入生产,并于2月开始交付。Grace Blackwell本季度将升级到GB300版本,推理性能提升1.5倍,HBM内存容量增加1.5倍,网络连接能力翻倍。
英伟达正在为中国台湾的AI基础设施和生态系统建造第一台巨型AI超级计算机。 下一代超算: 每秒14.4TB的全连接带宽,NVLink Spine、定制盲插背板及5000条铜线,每秒130TB带宽,整合72个Blackwell处理器或144个GPU芯片。
个人AI计算机: DGX Spark已全面投产,将在未来几周上市。搭载RTX 5060的全新MSI笔记本电脑,预计在五月上市。
与汽车行业并行推进机器人系统; 与DeepMind和DisneyResearch研究合作开发了全球最先进的物理引擎Newton,计划于七月开源。
-预计第三季GB架构服务器芯片升级成GB300,拥有1.5x记忆体、2x频宽、1.5x推论效能,整体机柜构造及设计维持不变
-单个NVLinkSwitch频宽7.2TB/s,透过Spine连接,总频宽达130TB/s,每机架功耗120kW,采全液冷系统。
-推出NVLinkFusion平台,构建半客制化AI基础设施,支援ASIC等AI加速芯片的高速互连,开发者可整合C2C技术、CPU、GPU、NVLink、ConnectX/Spectrum/Quantum等多种硬件,助力企业定制英伟达AI系统,合作伙伴包括联发科、MRVL、世芯、AsteraLabs、Synopsys、Cadence、富士通和高通。
-推出NVLinkChiplet模组,可整合NVLinkIP与英伟达核心架构相连,打造客制化芯片的NVLink高速互连生态系。
-推出全新Blackwell架构的RTXPro企业服务器,搭载8个最新RTXPro6000Blackwell显卡,采用x86架构,AI效能达30PFLOPS,RTX图形效能达3PFLOPS,频宽高达800Gb/s。
-为AI开发者打造的DGXSpark已进入全面量产,搭载128GBLPDDR5x,效能达1PFLOPS,适合研究人员在地部署AI开发及模型。
-推出个人AI超级电脑DGXStation,AI效能达20PFLOPS,搭载800GB系统整合记忆体,支援800Gb/s网路速度。
-推出GeForceRTX5060系列产品,包含台式机/笔电版本,透过DLSS技术,仅渲染10%像素,其余90%由AI推算。
-与电信商及设备商合作在RAN上导入AI。
-xAI的ColossusAI工厂达400万平方英尺、1.2GW,投资600-800亿美元,其中运算系统价值达400-500亿美元。
-宣布在NVIDIAConstellation台北办公室将坐落于士林。
-ASIC:英伟达授权Nvlink,合作厂商包含Alchip、Marvell、MTK、Cadence、Synophsis、Alab、Qualcomm,Fujitsu。NV直接提供ASIC芯片设计服务难以获客,主因CSP考虑供应商绑定。NV以nvlink授权,可能会带来ASIC设计市场份额变化。Marvell等厂商原本芯片间互联效果一般,通过NVlink可能会增强ASIC设计厂商获客能力。同时NV通过IP授权于ASIC市场分一杯羹。
-继续看好明年800G光模块/交换机:NV通过IP授权切入ASIC市场,看好ASIC中长期的趋势,明年ASIC整体出货量同比60%以上的成长,及CSP传统数据中心400G向800G升级趋势,对应800G光模块需求明年3500-4000万只需求,看好国内外头部光模块及上游光芯片及ASIC产业链,Lite、Credo、CLS。
-英伟达持续耕耘企业AI市场,推出DGX个人超级电脑及RTXPro企业服务器,将加速本地端AI开发及工作负载的装置部署,預期利好端侧算力需求,如栢能(01263HK)与Supermicro(SMCIUS)合作,供应电竞显卡架构的服务器,以满足国内企业AI需求。
预计2026年全球800G光模块出货将达3700万片(同比+85%),主要受每ASIC附加光模块数增加及海外云端基础架构从100G/200G/400G升级推动;但1.6T以太网交换机产能转换与客户准备周期延长,将使1.6T光模块需求推迟至2027年启动;CSP将更广泛接受二线供应商,产能与交付将决定市场份额。
2025/26年行业需求由2000万/2300万上调至2000万/3700万片,得益于Tomahawk5等主流800G交换机与高附着率;CSP仍以海外大厂为主导,二线厂商加速获批。
考虑到产能良率及迁移准备工作,2025-26年1.6T需求预测由230万/1200万降低至200万/500万,2H26或4Q26才会启动,更多需求将转移至2027年释放。
除GB200机柜装机良率提升带动2025年1.6T早期需求外,中东国家AI基础设施投资放量有望在2026年为1.6T需求带来增量。
在AI资本开支峰值担忧缓解、中美关税协议与需求预期改善下,光模块板块已从8-10倍FY25估值回升,预计将重估至15-20倍区间;首选Eoptolink(新易盛)、Innolight(中际旭创)。 大型CSP客户的光模块供应商:
亚马逊: 旭创,新易盛,AAOI,Fabrinet(爬坡) 谷歌:旭创,Lumentum,Coherent,TBD(新易盛) Meta:旭创, Coherent, 新易盛, Celestica(爬坡) 微软:旭创, Coherent, AAOI, Lumentum(爬坡) 英伟达: Mellanox(TFC), Coherent, 新易盛 甲骨文: 旭创, Coherent, AAOI(爬坡), Lumentum(爬坡)
据韩国媒体《ETNews》报导,为了纪念 iPhone 问世 20 周年,苹果正在开发多项技术创新,其中一项核心技术是「行动高频宽存储器」(Mobile HBM)。
为针对手机等行动装置设计的 HBM 变体,其目标是在保有高资料传输率的同时,降低功耗与存储器芯片面积。为提升装置端 AI 能力。
报导指出,苹果正考虑将 Mobile HBM 与 iPhone GPU 单元整合,作为实现此目标的有力选项。这项技术有望为iPhone 带来在地运行大型 AI 模型的能力,例如推论大型语言模型或进行高阶视觉任务,并兼顾低耗电与低延迟。
苹果可能已与主要存储器供应商,如三星电子与SK 海力士,洽谈合作方向。这两家公司目前都在开发各自版本的 Mobile HBM;三星采用名为 【VCS(Vertical Cu-post Stack)】技术,而 SK 海力士则研发 【VFO(Vertical wire Fan-Out)】方案,两者均预计于 2026 年后量产。
我们对技术的看法:未来端侧【含手机】具有非常强烈的提带宽+提容量+提功效+降封装厚度,将HBM端侧化是必然的选择,将存+算芯片极限靠近键合在一起基本也是必然选择;根据第一性原理,铜对铜混合键合技术是芯片间互联的最终解决方案,无论那种链接,最终的演化版本大概率是CuHB。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!