260515--美国近三年最大...
发布者:Vito的行研札记
但总体来说,这是一个典型的利基市场产品,注定小众化。任何讨论“这是否利空英伟达”和“这是否利空DRAM”的内容都没啥意义(每次讨论这个都给存储买点,如年初的LPU用SRAM叙事),这只能证明算力市场是一个持续扩容的beta,期间当然可以存在各种细分小众路线新玩家。举个不恰当的例子,这就像几年前硅谷出过模块化可拆卸手机,并不利空三星。
公司概况:Cerebras Systems成立于2016年,由Andrew Feldman等五位SeaMicro校友创办,总部加州Sunnyvale。 ——将整片300mm晶圆保持完整作为单一处理器,4万亿晶体管、90万AI核心、44GB片上SRAM、21PB/s内存带宽。2026年5月14日NASDAQ上市,定价$185 /股(三次上调),募资$55.5亿,完全稀释估值$564亿,20倍超额认购。2025年营收$5.1亿(+76% YoY),Non-GAAP净亏损$7570万(GAAP净利$2.38亿系含$3.63亿G42非现金收益的会计幻觉)。客户高度集中于阿联酋G42+MBZUAI(合计86%营收),与OpenAI签署$200亿+云服务协议(750MW→2GW,Cerebras承担DC建设运营风险,OpenAI提供$10亿贷款+3340万免费认股权证)。
Cerebras解决的是一个真实的物理学问题:LLM推理的decode阶段每生成一个token需读取全模型权重,H100 HBM带宽3.35TB/s限制理论上限约24 tok/s,而WSE片上SRAM带宽21PB/s是HBM的2625倍,实测~3000 tok/s。晶圆级制造的三大工程难题(良率/散热/互连)均已通过与台积电10年联合开发解决——这是半导体工程史上的里程碑。但三道结构性约束决定了天花板:WSE只在推理链条的一个环节(decode)有优势,训练和prefill仍需GPU;CUDA 400万开发者的network effect不可翻越;93%硅利用率+整片晶圆消耗导致成本结构性高于GPU。Cerebras大概率是利基市场产品而非主流平台——问题不是F1赛车的速度,而是赛道够不够长。
但这个利基可能比直觉上大。 推理占AI计算的比重正从~40%结构性增长至2028年的~70-80%,decode又占推理大头。AI推理市场到2028年约$2500亿,decode占60%=$1500亿,WSE在极端延迟场景拿5-10%=$75-150亿——本身就是大型半导体公司的体量。 三种场景:Bear(35%概率)推理解耦不成标准、Vera Rubin缩小差距→$20-50亿营收天花板/$100-250亿市值;Base(45%)部分场景标准化、2-3家超算采用→$50-150亿/$300-600亿(与当前估值匹配但需完美执行);Bull(20%)全面标准化→$150亿+/$800亿+。
Tech-Certainty判定:值得怀疑。 瓶颈急迫度P1_IMMINENT(decode带宽瓶颈真实但HBM改良+量化等绕行方案可部分缓解),方案清晰度SEGMENTED(WSE在decode niche最优但GPU在95%场景"够好了"),产业资本方向DIVERGENT—— 。DIVERGENT自我质疑5项中4项确认WSE路线降级为CONTESTED。DEDUCE-B价值链穿透5层后发现Cerebras高度垂直整合(芯片/封装/互连/冷却全自研),外部依赖仅台积电5nm(消耗 。
6个月内OpenAI DC能否交付百MW级(执行力验证);12个月内第二家非OpenAI超算客户是否出现(SPECULATIVE→EMERGING_CERTAIN的分水岭);18-24个月NVIDIA Vera Rubin decode性能是否缩小差距至2x内(Itanium式"够好了"风险)。操作结论:WATCH不追,NVIDIA份额压缩的真正驱动力是ASIC双寡头AVGO+MRVL(+45% YoY),与Cerebras无关。