**EvercoreISI**...
发布者:麦子
**EvercoreISI**
2026年第一季度AI渠道调研:GPU与ASIC 我们询问了50多位AI工程师以及与AI基础设施领域各公司合作的专家,探讨了AI基础设施的竞争格局。 主要主题包括:1)AI工作负载正在从训练主导转向推理主导(到2026年底);2)对每代币成本、投资回报率和总拥有成本的关注日益增加,这正在加速超大规模企业对自研ASIC和其他加速器的投入;3)英伟达拥有广泛的生态系统护城河,源头信息加微Macro_Guru但其市场份额在超大规模企业/前沿实验室层面正受到考验;4)推理场景下异构计算环境的可能性似乎越来越大;5)随着小型语言模型的改进,“边缘推理”的兴趣日益浓厚。 推理成为主流:渠道调研显示,从训练繁重的2025年转向推理占主导的2026年,多位受访者预计到2026年底,推理需求将占到50%至60%,且随着时间推移还会大幅增长。(参见《 》) ROI压力挤压XPU利润率:推理工作负载将购买标准从“最大吞吐量/带宽”转向“每代币成本、功耗、散热、利用率”。 英伟达声称的35倍性能提升并未引起共鸣,超大规模企业认为英伟达的GPU价格过高,愿意使用ASIC或“足够好”的替代方案来提高经济效益。 英伟达训练份额依然高企,推理份额到2028年降至50%:源头信息加微Macro_Guru专家预计英伟达在训练领域将保持领先(长期份额>70%),但推理份额预计到2028年将降至50%,因为AMD、TPU、Trainium、Maia、SRAM芯片都在改进。 VeraRubin进展顺利-B300交货周期延长:调研显示,没有严重的供应链问题,超大规模企业在第二季度收到机架,企业级ODM/Neocloud在第三季度收到。 Blackwell的需求vs初期预期较低,对Rubin的兴趣更大。 B300的交货周期从上季度的12周延长至16周。 代理驱动解码特定芯片:调研显示,解码可能需要与传统GPU/HBM中心化架构不同的硅架构(例如英伟达、GroqLPU、Cerebras)。