返回话题列表
乐晴行业观察
2025/10/28 08:38
类型 talk 14阅读 1

半导体更新:高通+AMD+存储...

发布者:乐晴

半导体更新:高通+AMD+存储...半导体更新:高通+AMD+存储...

①费城半导体指数创下历史新高。

②高通涨超11%,创2024年7月以来新高。公司推出人工智能芯片,在数据中心市场与英伟达展开竞争。高通AI200和AI250预计分别于2026年和2027年投入商业使用。

③路透:美国能源部与 AMD 建立 10 亿美元超级计算机和人工智能合作伙伴关系,共同打造两台超级计算机。

④存储龙头三星电子或针对12层HBM3E推出30%的降价策略。

事件概览:高通最新发布两款用于数据中心的人工智能芯片,分别为AI200和AI250,拟进军数据中心领域。公司此举,旨在为多元化发展方向进行进一步布局

1)AI200将于2026年开始供货,AI250将于2027年开始发货。两款产品的差异主要体现在:AI250将提供AI200大概10倍的内存带宽。

2)目前公司在数据中心的产品布局包括:

(a)AI 100 Ultra卡,主要用于数据中心训练领域。

(b)25年6月公司宣布有意收购 Alphawave,旨在助力高通拓展人工智能驱动的数据中心市场。一方面,Alphawave可以将其在高速连接领域中的技术(包括 SerDes 和芯粒),与高通的 Oryon CPU和Hexagon NPU处理器形成互补,提升了高通为人工智能驱动的数据中心工作负载提供高性能、低功耗解决方案的能力。另一方面,Alphawave在有线连接和定制芯片方面的专业能力,能够实现更快、更可靠的数据传输,同时降低功耗。

1)视频生成需要大量内存。

我们认为高通设计选择旨在优化当前瓶颈:即推理时的内存容量和每token能耗,而非训练吞吐量,避免了2025-2026年HBM供应瓶颈。

LPDDR通常每GB成本更低,且比服务器DDR更省电,尽管其带宽远低于HBM。

通过将计算单元紧密部署在LPDDR旁,并在AI250中分层实现近内存计算方案,我们认为对于广泛的大模型推理工作负载,内存容量、访问局部性和批处理行为对总拥有成本(TCO)的影响,远大于单纯的峰值张量计算单元。这种方案适合推理,但不适合需要模型并行的训练相关任务则吸引力较小。

2) Humain(沙特AI公司)客户已经签的合作协议具有标杆性,但其它非中东客户或许待进一步拓展?

高通表示,每个机架的功耗为160千瓦;因此,200兆瓦的部署大约需要1250个机架(200,000千瓦 ÷ 160千瓦/机架)。

根据机架级别的定价和配置,这一个客户就可能带来非常可观的多年硬件收入。

作为高端机架级AI系统的基准,英伟达的GB200/GB300 NVL72机架的价格范围在260万至300万美元之间。

如果单个mw价格类似,按照最乐观场景看这么算确实EPS会在27年多10%,我们认为中东客户一向乐于采购各种新AI芯片产品,sambanova groq cerebras等等最大客户均位于中东,能否拓展北美客户或者为实际容量

3)互联:高通即将进行的24亿美元Alphawave收购来增强其高速连接IP,这与芯片间互连(chiplet I/O)、串行器/解串器(SerDes)以及机架级互连相关IP。如果高通打算在机架/机柜规模上扩展到解耦推理和内存池,那么这一点至关重要。

美国能源部长克里斯·赖特和 AMD 首席执行官苏姿丰向路透社表示,美国已与超微半导体公司 (AMD.O) 达成 10 亿美元合作协议,建造两台超级计算机,用于解决从核能到癌症治疗到国家安全等大型科学问题。

美国正在建造这两台超级计算机,以确保该国拥有足够的超级计算机来运行日益复杂的实验,这些实验需要利用海量的数据处理能力。这些超级计算机可以加速美国重点领域的科学发现进程。

根据计划,第一台名为 Lux 的计算机将在未来六个月内建成并投入使用。它将基于 AMD 的 MI355X 人工智能芯片,设计还将包含 AMD 生产的中央处理器

(CPU) 和网络芯片。该系统由 AMD、惠普企业 (HPE.N)、甲骨文云基础设施和橡树岭国家实验室 (ORNL) 共同开发。

第二台更先进的计算机名为“发现号”(Discovery),将基于 AMD 专为高性能计算而调校的 MI430 系列 AI 芯片。该系统将由 ORNL、HPE 和 AMD 共同设计。“发现号”预计将于 2028 年交付,并于 2029 年投入使用。

据我们了解,三星本次HBM降价仅限对英伟达的HBM3e(12层)产品,主要系该产品三星推出节奏(25年四季度nv出货)落后于友商(海力士、美光)3-4个季度,目的旨在大客户层面抢占市占率。

本次降价在一定程度上,会影响HBM产品的毛利率水平。

不影响其他产品的供需逻辑;存储市场AI需求成长逻辑依旧。

10月27日,存储龙头三星电子已推出30%的降价策略,希望抢占市场,这个只是一方面。

我们此前从产业了解到的信息是,三星海力士美光明年依然在HBM上有扩产预期,整体在15w片/月,预计明年整体在47.6w片,对应下游GPU量级在1800w~1900w张,未来或将有降价可能预计降幅在5~10%,而HBM降价不会影响Dram和Nand在此轮行情中的涨价趋势。

随着AI时代tokens消耗量增加和端侧需求的增加,我们预计存储行业涨价继续,参考1024产业最新行情数据:明年Q1 dram价格涨幅预计在17~18%(原6~7%),Nand预计在16%(原5%);Q2 Dram和NAND 预计在20%(原预计看端侧),明年年中前价格涨势都不太用担心。

By zyy

存储是周期性最强的半导体品种。

看对周期做对周期,是存储企业一种竞争成长范式!这一次,业内人士也低估了,采取了高周转策略,因此10月目前供需非常紧张。

NAND颗粒/SSD普遍+50%,DRAM由于上一轮调整较少,涨幅滞后、但上周已跟进。

受AI&产能结构调整影响,全球存储涨价超预期。

2025年10月全球存储芯片市场持续涨价,三星、SK海力士等头部厂商宣布第四季度DRAM合同价最高上调30%,NAND闪存合同价上调5%-10%。一方面AI驱动需求爆发,AI服务器对高性能存储(如HBM、DDR5)需求激增,挤压传统DRAM产能,导致DDR4等产品供应紧张;另一方面DRAM库存周期从2023年的31周降至2025年10月的8周,原厂削减DDR4产能转向高利润的HBM和DDR5。

两大存储FAB加速新产能扩张,看好设备国产化率提升。

长存三期(武汉)集成电路有限公司于9月5日成立、7月7日国产DRAM内存龙头长鑫存储正式启动上市征程;寒武纪和海光最新财报当中的营业收入和出货量也侧面反应了中芯国际先进逻辑产能的良率正在提高。我们认为国产半导体设备自身迎来历史性发展机遇,26年将会开启确定性强的扩产周期,设备全行业订单增速或超过30%,有望达到50%+。

看好两存敞口较高的设备商(新签订单两存占比):北方华创(35%)、中微公司(70%)、拓荆科技(65%)、微导纳米(90%+)、迈为股份(90%+)。

风险提示:下游扩产速度不及预期,设备国产化进程不及预期。

1)KV Cache代表了推理的规模化,而推理规模化需要RAG。

2)如果把大模型比作学生。

KV Cache像是这个学生解题时用的“草稿纸”。RAG是这个学生考试时允许带的“官方参考资料手册”,确保答案准确、有依据。

向量数据库就是这本“参考资料手册”的智能目录和索引系统。

KV Cache和RAG存储的爆发,必然带来向量数据库需求的大增,XHKJ等厂商有所布局。

25Q1-Q3新签订单达32.49亿元, 超24全年

公司25Q1-Q3新签订单金额达到 32.49 亿元,已超过 2024 年全年新签订单(29.30 亿元),创下历史新高。其中,25Q3末在手订单中,互联网、云服务厂商、车企及其他系统厂商占比高达 83.52%,体现公司在高增长客户群体中的深度绑定与持续渗透,为未来业绩释放奠定了坚实基础。

营收结构亮点突出:芯片设计与量产业务翻倍增长

从 25Q3 收入构成来看,公司两大板块营收单季度实现接近翻倍增长:

-芯片设计业务 收入4.28 亿元(YoY +80.23%,QoQ +290.82%);

-量产业务 收入6.09 亿元(YoY +157.84%,QoQ +132.77%)。

公司AI算力相关收入占芯片设计业务的73%,表明公司已在智能计算与数据中心方向形成领先布局。前三季度,公司共有 112 个量产项目、47 个待量产项目——❗#多个4nm/5nm一站式芯片定制服务项目正在执行。

研发投入结构优化,盈利能力持续改善

前三季度,公司研发投入同比下降,公司在公告中指出,“设计资源陆续投入客户项目,研发投入占比合理下降”。部分研发人员转入项目执行阶段,相关成本计入项目成本而非研发费用。同时公司Q3归母净利润-0.27亿元,qoq+73%,公司盈利能力正快速修复,扭亏在即。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!