AI算力链更新 ①海外AI芯...
发布者:乐晴
①海外AI芯片新星Cerebras上市,公司系全球唯一晶圆级AI芯片全栈厂商,专注高速推理。
②英伟达七连涨,日内涨超4%,续创新高,总市值5.71万亿美元。瑞银上调英伟达目标价至275美元。
③美国批准阿里巴巴,腾讯,字节跳动参与英伟达H200s项目。
Cerebras 5.14在纳斯达克上市,完全稀释后上市市值564亿美元左右。
值得注意,OpenAI Sam Altman个人也有持股。
产品:晶圆级AI推理芯片,台积电N5工艺。将整片300毫米晶圆WSE-3作为单一巨型芯片使用
芯片面积和晶体管数量是NV B200的19x,内存带宽21PB/s是NV B200的2625x,峰值算力达125PFLOPS,是B200的6x。
独特优势:超低延迟
WSE-3的90万个计算核心可以直接访问44GB片上SRAM,延迟仅为一个时钟周期,在处理长序列、多批次推理任务时,理论上可以比GPU快15-1000倍。
缺陷:面积过大导致良率问题,Cerebras用冗余设计解决;散热问题,单颗芯片功耗约15kW,相当于一台小型空调的功率,需用专用液冷散热系统。
商业模式
卖硬件+云服务,25年收入5.1亿,主要来自向中东MBZUAI、G42(算力服务提供商),其中卖硬件收入3.58亿元,云服务收入1.52亿元,26年看有两个重要客户:
1)OpenAI 200亿美元合同:2026年1月,Cerebras与OpenAI签署合作协议,openAI租用CBRS 26-28年共750MW AI算力(每年250MW),OpenAI另拥有在2030年前追加至多1.25吉瓦算力的选择权,合同价值超过200亿美元,OpenAI向Cerebras提供10亿美元贷款(年利率6%),并获至多3340万股Cerebras N类股票的认股权证,该权证仅在OpenAI累计采购算力达2GW时完全归属。
2)AWS:2026年3月,亚马逊AWS宣布将Cerebras芯片纳入其数据中心AI算力架构,客户可通过Amazon Bedrock调用Cerebras算力。亚马逊还获得了价值约2.7亿美元的Cerebras N类股票认购权。
财务数据:2025年全年营收5.10亿美元,较2024年的2.903亿美元增长76%。但25年nonGAAP净亏损7570万美元,同比扩亏。
全球唯一晶圆级AI芯片全栈厂商 、专注于高速推理的算力新星
1)IPO热度打满 :发行价区间由115–125美元上调至150–160美元,发行3000万股(原计划2800万股),超额认购20+倍 ,募资上限约48亿美元,完全摊薄市值最高488亿美元;半年内估值翻6倍 (81→230→488亿美元)。
2)公司画像 :2015年成立于硅谷,创始团队来自SeaMicro(2012年被AMD以3.34亿美元收购);全球唯一晶圆级AI芯片全栈厂商,自研芯片+整机集成+自建数据中心+推理云服务全自营;不单卖芯片 ,以系统销售(约70%)+云推理服务(约30%)为核心收入来源。
3)技术参数 vs GPU :WSE-3对比H100——芯片面积57x、晶体管数50x、AI核心数53x、片上SRAM 880x (44GB vs 50MB)、内存带宽7000x (21PB/s vs 3TB/s);公司宣称推理速度比传统GPU快15–20倍,特定场景超1000倍,长期位居Hugging Face推理供应商榜单前列 。
4)推理时代的架构红利 :与AWS深度共建分离式推理架构 (Trainium负责Prefill,CS-3负责Decode),2026H2向Bedrock客户开放;规避DRAM/HBM/CoWoS最紧张的三个环节 ,采用5nm制程规避3nm产能短缺;管理层指引未来几年产能扩张上限每年十倍 。
5)业绩与订单可见度极高 :2025年营收5.10亿美元,yoy+76%;2025年底RPO达246亿美元 ,订单/收入比近50:1;GAAP毛利率39%,远期目标60%。
6)OpenAI大单 :2026年1月签下OpenAI 750兆瓦/200+亿美元长约,叠加10亿美元运营资金贷款;预计2026–2027年OpenAI将贡献约90%收入;TSMC已成为Cerebras股东 ,2026年积极响应扩产,公司从"去年未进入TSMC前150大客户"跃升至"今年前15"。
华泰计算机 郭雅丽/范昳蕊/袁泽世/岳铂雄/王浩天/徐诚伟
大厂Capex显著上修,AI商业化收入爆发
腾讯: 26Q1单季Capex达319亿元,同/环比大幅增长16%/63%,主要用于支持AI基础设施建设与算力资源采购。公司明确表示下半年资本支出将进一步增加,会有更多国产芯片陆续投入使用。企服收入在AI强力驱动下同比大增20%,Hy3 preview及WorkBuddy等多款AI模型与应用稳居行业头部。
阿里: 当前AI服务器几乎满载,未来3到5年AI数据中心投资回报确定性极高,为获取算力中心所投入的资金将远超此前规划的3年3800亿元。本季度AI相关产品收入达89.71亿元,连续11个季度保持三位数增长,占外部云收入比重达30%,预计一年内将突破50%;MaaS业务ARR预计6月突破100亿,年底将突破300亿。
业务逐步跨越投入期,有望迎来重估
阿里在业绩会指出,MaaS业务的毛利率高于传统IaaS,且随着大模型推理成本的不断优化与Token产能的提升,未来1-2年阿里云整体毛利率将迎来显著改善。同时,目前相同服务器部署的重置成本较两年前提升近100%,不仅对客户需求产生强定价牵引,也将进一步推高云服务的盈利中枢。随着大厂在AI基础设施上的投入逐步转化为收入与利润,云有望迎来重估。
Agent重塑底层架构,CPU逻辑持续强化
区别于传统LLM推理的GPU密集型任务,Agentic AI涉及观察环境、多步逻辑推导与执行动作,其严格的因果串行逻辑高度依赖CPU,且CPU极难享受AI算法的量化与稀疏化红利。随着Agent爆发,AI服务器内GPU与CPU的配比正从目前的8:1向2:1甚至1:1演进,同时柜外沙箱执行节点也将催生海量独立的CPU节点需求。
阿里腾讯财报定调AI高景气,持续看好算力全产业链,尤其是受益于Agent爆发的CPU环节,以及赋能集群落地的算力服务方向。相关:海光信息、中科曙光、深信服等。
中信建投计算机团队应瑛/方闻千/王嘉昊/张敏/李楚涵
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!