EvercoreISI...

发布者：麦子

**EvercoreISI**

2026年第一季度AI渠道调研：GPU与ASIC 我们询问了50多位AI工程师以及与AI基础设施领域各公司合作的专家，探讨了AI基础设施的竞争格局。主要主题包括：1）AI工作负载正在从训练主导转向推理主导（到2026年底）；2）对每代币成本、投资回报率和总拥有成本的关注日益增加，这正在加速超大规模企业对自研ASIC和其他加速器的投入；3）英伟达拥有广泛的生态系统护城河，源头信息加微Macro_Guru但其市场份额在超大规模企业/前沿实验室层面正受到考验；4）推理场景下异构计算环境的可能性似乎越来越大；5）随着小型语言模型的改进，“边缘推理”的兴趣日益浓厚。推理成为主流：渠道调研显示，从训练繁重的2025年转向推理占主导的2026年，多位受访者预计到2026年底，推理需求将占到50%至60%，且随着时间推移还会大幅增长。（参见《》） ROI压力挤压XPU利润率：推理工作负载将购买标准从“最大吞吐量/带宽”转向“每代币成本、功耗、散热、利用率”。英伟达声称的35倍性能提升并未引起共鸣，超大规模企业认为英伟达的GPU价格过高，愿意使用ASIC或“足够好”的替代方案来提高经济效益。英伟达训练份额依然高企，推理份额到2028年降至50%：源头信息加微Macro_Guru专家预计英伟达在训练领域将保持领先（长期份额>70%），但推理份额预计到2028年将降至50%，因为AMD、TPU、Trainium、Maia、SRAM芯片都在改进。 VeraRubin进展顺利-B300交货周期延长：调研显示，没有严重的供应链问题，超大规模企业在第二季度收到机架，企业级ODM/Neocloud在第三季度收到。 Blackwell的需求vs初期预期较低，对Rubin的兴趣更大。 B300的交货周期从上季度的12周延长至16周。代理驱动解码特定芯片：调研显示，解码可能需要与传统GPU/HBM中心化架构不同的硅架构（例如英伟达、GroqLPU、Cerebras）。

**EvercoreISI**...

EvercoreISI...