260515--美国近三年最大...

发布者：Vito的行研札记

但总体来说，这是一个典型的利基市场产品，注定小众化。任何讨论“这是否利空英伟达”和“这是否利空DRAM”的内容都没啥意义（每次讨论这个都给存储买点，如年初的LPU用SRAM叙事），这只能证明算力市场是一个持续扩容的beta，期间当然可以存在各种细分小众路线新玩家。举个不恰当的例子，这就像几年前硅谷出过模块化可拆卸手机，并不利空三星。

公司概况：Cerebras Systems成立于2016年，由Andrew Feldman等五位SeaMicro校友创办，总部加州Sunnyvale。 ——将整片300mm晶圆保持完整作为单一处理器，4万亿晶体管、90万AI核心、44GB片上SRAM、21PB/s内存带宽。2026年5月14日NASDAQ上市，定价$185 /股（三次上调），募资$55.5亿，完全稀释估值$564亿，20倍超额认购。2025年营收$5.1亿（+76% YoY），Non-GAAP净亏损$7570万（GAAP净利$2.38亿系含$3.63亿G42非现金收益的会计幻觉）。客户高度集中于阿联酋G42+MBZUAI（合计86%营收），与OpenAI签署$200亿+云服务协议（750MW→2GW，Cerebras承担DC建设运营风险，OpenAI提供$10亿贷款+3340万免费认股权证）。

Cerebras解决的是一个真实的物理学问题：LLM推理的decode阶段每生成一个token需读取全模型权重，H100 HBM带宽3.35TB/s限制理论上限约24 tok/s，而WSE片上SRAM带宽21PB/s是HBM的2625倍，实测~3000 tok/s。晶圆级制造的三大工程难题（良率/散热/互连）均已通过与台积电10年联合开发解决——这是半导体工程史上的里程碑。但三道结构性约束决定了天花板：WSE只在推理链条的一个环节（decode）有优势，训练和prefill仍需GPU；CUDA 400万开发者的network effect不可翻越；93%硅利用率+整片晶圆消耗导致成本结构性高于GPU。Cerebras大概率是利基市场产品而非主流平台——问题不是F1赛车的速度，而是赛道够不够长。

但这个利基可能比直觉上大。推理占AI计算的比重正从~40%结构性增长至2028年的~70-80%，decode又占推理大头。AI推理市场到2028年约$2500亿，decode占60%=$1500亿，WSE在极端延迟场景拿5-10%=$75-150亿——本身就是大型半导体公司的体量。三种场景：Bear(35%概率)推理解耦不成标准、Vera Rubin缩小差距→$20-50亿营收天花板/$100-250亿市值；Base(45%)部分场景标准化、2-3家超算采用→$50-150亿/$300-600亿（与当前估值匹配但需完美执行）；Bull(20%)全面标准化→$150亿+/$800亿+。

Tech-Certainty判定：值得怀疑。瓶颈急迫度P1_IMMINENT（decode带宽瓶颈真实但HBM改良+量化等绕行方案可部分缓解），方案清晰度SEGMENTED（WSE在decode niche最优但GPU在95%场景"够好了"），产业资本方向DIVERGENT—— 。DIVERGENT自我质疑5项中4项确认WSE路线降级为CONTESTED。DEDUCE-B价值链穿透5层后发现Cerebras高度垂直整合（芯片/封装/互连/冷却全自研），外部依赖仅台积电5nm（消耗。

6个月内OpenAI DC能否交付百MW级（执行力验证）；12个月内第二家非OpenAI超算客户是否出现（SPECULATIVE→EMERGING_CERTAIN的分水岭）；18-24个月NVIDIA Vera Rubin decode性能是否缩小差距至2x内（Itanium式"够好了"风险）。操作结论：WATCH不追，NVIDIA份额压缩的真正驱动力是ASIC双寡头AVGO+MRVL（+45% YoY），与Cerebras无关。