返回话题列表
乐晴行业观察
2026/04/17 08:57
类型 talk 10阅读 1

AI算力链更新:国产算力+算力...

发布者:乐晴

1)需求端斜率可能再往上

国产模型与Tokens的变化是需求侧来源,字节单日tokens消耗达到120万亿(相较于去年年底接近翻倍,seedance贡献较大)、智谱年内ARR大超预期,国内的模型进步和用户使用习惯在26年达到拐点,需求侧斜率我们认为还会继续往上,需求缺口非常大。

主要原因包括seedance正式公测、国内各种应用端包括AI-coding处于爆发期、Agent拐点将近。

2)国内芯片侧有望改善

一季度的IDC/算力租赁先行,我们底部关注并持续看好;

二季度我们开始看好国内芯片侧以及相关产业链的变化。

主要系供给侧的卡点在二季度有望边际缓解;叠加算力租赁产业看到交货期可能延长,国内芯片供给侧改善带来的边际变化可能会非常剧烈,我们看到产业链紧缺的程度还在加剧,包括AI芯片、交换机芯片、智能网卡等。

算力租赁价格持续上涨、海内外共振

海外GPU租赁价格持续上涨,国内趋势类似,看好国产算力板块的“通胀”环节

这个边际上看好什么?

1)双王:寒王我们看好需求侧再下一城,供给侧二季度大幅缓解卡点,海王看好DCU/CPU带来的产业机遇。

2)华为:今年是华为竞争力逐步向上的一年,950系列竞争力提升与供应端的优势在逐步体现,HW看好高速连接器的供应商,224G连接器更新换代带来新机会。

3)交换芯片:TH5缺到涨价,新供应商的引入迫在眉睫,盛科通信。

4)IDC:东阳光、豫能控股(结束重点监控)

5)算力租赁:宏景、协创、利通

缪欣君/刘鉴/丁子惠

我们4月初发布的国产算力思考:1)国产芯片份额快速提升;2)国产超节点成熟即将出货,成为本轮国产算力交易的主线。

当前继续看好!基于四点逻辑

1)需求爆发

Token消耗:豆包目前已经日均120万亿,3个月翻一倍;

商业化收入:Kimi 2月单月收入与25全年相当;

应用形态:丰富,Openclaw或许只是开胃菜,后续Hermas、多模态形态产品百花齐放。

2)算力硬件通胀向Token传导的路径更为畅通

Claude 更改订阅制为按照Token消耗收费,模型、云厂Capex提升的痛点,推理算力投入变成运营成本。国内目前按照Token消耗阶梯定价,智谱等高端Token也有持续的涨价预期。

3)国产超节点产业的全面Ready

从服务器机柜,到交换芯片,到连接系统,已经为国产超节点放量打下基础,预计Q3开始超节点出货,国产算力能力系统级提升,ROI变化驱动大厂采购国产意愿升级。

4)26H2,预计国产芯片厂商新品推出,能力最高对标Blackwell

包括但不限于华为950DT、海光信息DCU 4、天数智芯天垓Gen4、摩尔线程花港新架构产品等,整体Spec上升到对标 NV Blackwell系列产品水平。

寒武纪、海光信息、天数智芯、壁仞科技、沐曦股份、摩尔线程、芯原、百度(昆仑芯)

华为链:杰华特(电子)、泰嘉股份(电子)、航天电器(军工)、长川科技(机械)、银轮股份(汽车)

交换系统:盛科通信、锐捷网络

服务器:浪潮信息、华勤技术(电子)、联想集团

2026是极度缺卡的一年,目前各家卡都逐渐从可用进入好用的阶段,瓶颈还是在于供给能力。

沐曦股份:目前在供给能力上排在前列,P客户放量的一年,目前头部三家P进展顺利;

天数智芯:2026年是P客户放量元年,头部P进展顺利;

壁仞科技:BR20X性能很好,今年7-8月有望回片,进入P客户;

摩尔线程:目前产能可以支持在手订单,25年年底开始做互联网的布局,目前已经有小批量。

此外,switch方面,2026年阿里磐久128卡超节点、昆仑芯64卡超节点等均有望批量出货数千台量级,且scale-up国内主流的比例为switch:AI芯片=1:2,叠加国产化需求下,份额提升将非常快,看好盛科卡位优势

ABot-PhysWorld、HappyOyster、happyhouse

核心事件:阿里近期连发三款世界模型,技术井喷,算力告急:

1)ABot-PhysWorld:登顶WorldArena榜首,超越GigaWorld、Google Veo,在物理规律理解与长程动态预测上全球领先

2) HappyOyster:全球首个可实时交互的开放式世界模型,支持场景实时响应、世界持续演化

3)HappyHouse:阿里第三款世界模型,与HappyOyster形成产品矩阵

算力荒加剧!四天三涨,涨价潮席卷全球

阿里云四天连发三条涨价公告,AI算力产品全线涨价5%-34%。Anthropic同步涨价,重度用户成本或翻倍。OpenRouter周度Token消耗量较一年前提升约7-8倍,国产大模型市占率约40%。

三款世界模型的“实时生成+物理预测+持续演化”,都指向一个结论:模型越强,算力消耗越大!算力租赁商业模式正从“卖算力”转向“卖Token”,议价权提升,盈利能力有望重构。

结论:阿里三款世界模型密集发布+全球算力荒共振,算力底座是确定性最高的受益方向。

近期海内外算力相关价格密集上调:

1)4月15日阿里云上调大模型平台百炼部分模型单元服务价格,涨幅约2%-5%。

2)Anthropic将ClaudeEnterprise由40-200/用户/月订阅制,调整为20基础费用+按算力消耗计费,重度用户实际成本或提升2-3倍。

3)SemiAnalysis数据显示,H100一年期租赁价格由2025年10月约1.70美元/小时/GPU提升至2026年3月的2.35美元/小时/GPU,半年涨幅接近40%。

多重价格信号验证,算力供需紧张持续加深。云厂商/模型厂商提价+GPU租赁价格上涨体现算力供需格局持续收紧,短期难以显著缓解。

付费机制从固定订阅转向按量计费,加速算力成本传导。Anthropic企业版由订阅制向按Token/算力消耗计费转变,体现模型厂商逐渐向下游传导算力成本,企业工作负载正从固定席位生产工具转向Agent应用,企业端AI使用深度与调用强度持续提升。

AI进入“Token经济+算力约束”阶段,上游算力资源定价权持续强化。

算力环节(GPU/ASIC/云服务)业绩确定性进一步提升,需求持续放量与供给约束延续的背景下收入与盈利潜力有望加速释放,建议关注具备token闭环生态与算力定价权的头部云厂商阿里巴巴、微软和核心算力基础设施龙头厂商博通、Marvell。

4月下旬北美hyperscaler财报窗口临近,云厂商capex及需求端指引有望进一步催化。

去年 2025 年,AI 刚爆火,高端 GPU(H800)全网缺货。谁能抢到卡、谁敢发公告,股价就涨。大家赚的是 "囤卡涨价" 的钱 —— 卡越缺、价越涨,随便租出去都暴利。那时候不管成本、不管客户、不管电,有卡 = 赚钱,全是 "炒预期"。

而今年开始,逻辑彻底变了:

1)从谁都能做,到头部集中去年随便一家公司都能蹭热度;今年只有有官方渠道(NCP)、有低成本电、有大资金、有大客户的公司才能活。

2)从抢卡,到拼成本前几年卡价飞涨,怎么买都赚;今年 B300 价格固定,拿货价、电费、资金成本直接决定赚不赚钱。

目前租赁价格,单台15万/月,年化180万;b300拿货价为43万美金(310万人民币),算上折旧+电费+财务费用,基本2年半回本;

如果成本控制的低,比如电费便宜,自有现金流充沛,更有优势

3)从赚差价,到长单现金流去年囤卡倒卖赚快钱;今年要签 1-3 年长单、稳定运营、按月收钱,靠服务和效率赚钱。

从这些都不难看出,今年的算租行业,从原来的单纯炒题材,转变成真正能出业绩的成长赛道,从各公司业绩公告都能印证。

简单说,原来是炒的是市梦率,不看利润,只看未来有多少卡;而如今,主要是看这几个维度:1有拿卡正规渠道(NCP);2有长协订单(下游大厂绑定);3再加上公司现金流充沛(有成本优势);简单算一笔账,按照1000张B300的利润率测算

如果租赁价格是15万/月(还在涨价),一年能产出7-8个亿的净利润。

供需格局分析:三大CSP厂商存在结构性缺卡情况,核心缺口为高端算力卡,是旗舰多模态模型推理、大模型基座训练、龙虾及类龙虾高性能agent调用、云厂商核心业务等场景的必需资源。

英伟达高端卡在上述场景中不可或缺,若不使用将面临成本难以覆盖,或是推理稳定性、准确度下降的风险。供应端国内H100进口总量约20-30万张,A100、A800已停产,H200进口困难,供需缺口显著,推动算力租赁行业需求与价格抬升。

价格变动情况:首先明确两类相关业务边界:算力租赁核心业务为服务器、硬件租赁,AI数据中心(AIDC)核心业务为机柜空间出租。根据semi analyze统计数据,算力租赁产品价格近期明显上涨:H100租赁价格从2025年10月的1.7美元/小时上涨至2026年3月的2.35美元/小时,涨幅接近40%;B100八卡服务器价格上涨52%,从此前380万的配置版本涨至当前500余万。

AIDC行业发展与机会

算力需求增长分析:Agent爆发拉动算力需求大幅提升,单Agent任务的Token需求量是传统Chatbot的10~50倍,峰值下甚至可达100倍。

国内日均Token调用量增长迅猛,2024年初仅为1000亿,2025年中升至30万亿,2025年底达100万亿,截至2026年3月已突破140万亿,增速极为可观。此背景下,AIDC作为不可或缺的算力基础设施,需求量随算力需求攀升持续增长。

中美市场对比分析:OpenRouter平台数据显示,2026年3月中旬中国Token调用量已超过美国,3月底至4月初达美国的4倍,但美国AIGC运营量仍是中国的3~5倍。

美国能源管理委员会(FERC)报告显示,2025年底美国在运营数据中心体量为50GW,2020年以来年复合增长率为24%;同期中国在运营数据中心体量约为10GW,与美国差距较大,国内AIGC行业发展空间充足。据测算,仅2026年三大CSP云厂的AIDC需求就达4~5GW,行业中长期投资价值凸显。

按三大CSP云厂供应链分类,相关:

a. 字节供应链:润泽、光环新网、秦淮数据、万国数据、世纪互联;

b. 阿里供应

1)中美AI算力大概是差80倍左右,未来两三年内国内应该会超过10万亿的这个基础算力的投资规模,希望公司在这里面做到绝对领先的地位;

2)存储行业这次的供应和需求差,只有在1984年发生过,那次存储是从1984年涨价,一直涨到1995年,大概涨了11年。未来三年的存储的产能已经被包了,特别是像Solidigm这样的公司,它这3年内都有人预付包了产能;

3)存储原厂的毛利率太高了,涨价的趋势会减缓,幅度会放慢,但这个缺货的趋势,我个人认为在3~5年内是没办法改变的,存储扩厂的速度也远远跟不上需求的扩张;

4)通过并购光维(国家超算唯一入围供应商)切入光模块领域,其800G/400G/1.6T产品无需博通DSP,功耗降低70%,广州超大规模工厂预计2026年Q4贡献收益;

10、算力租赁专家交流纪要

行业现状与核心关切

近期,算力租赁赛道呈现全球性高景气。海外代表企业CoreWeave、Nebulas股价在半个月内暴涨约60%,国内龙头协创数据2026年第一季度净利润预告同比暴增284%至402%。一边是海外千亿级长单密集落地,一边是国内业绩集体“炸裂”,标志着算力租赁已成为AI时代最确定的增长赛道之一。在此背景下,市场集中关心中美商业模式的本质差异、长单签订的底层逻辑、国内外利润率悬殊的原因、超威事件后高端GPU的供给状况,以及2026年至2028年行业景气的可持续性。

2. 中美商业模式的关键异同

中美算力租赁的商业本质相同,都是“重资产代持+按月收费”的模式,即由服务商承担昂贵的服务器固定资产投入,为客户提供算力服务,将客户的资本开支压力转移给专业运营商。然而,关键差异体现在合同细节上。海外市场以超长锁价合同为主,例如CoreWeave与Meta的订单直接签至2032年,总金额超350亿美元,呈现“头部对头部、一生一世一单”的深度绑定格局,且头部客户通常无需支付预付款,依赖信用合作。国内市场则更为灵活,当前主流合同是“3+2”模式,即前3年为闭口锁价合同,后2年价格随行就市;用于推理的小卡合同则以12个月为主。预付款方面,在国内供给紧张时曾出现预付1-3个月租金的情况,目前市场趋向于由服务商垫资建设,头部客户也较少预付。此外,国内商业模式还有一个特殊核心:帮助客户将受管制的非合规GPU转化为合规运营的算力,这是大量跨界资本涌入的重要动因。

3. 大厂选择租赁的核心逻辑

2026年,对于互联网大厂和AI公司而言,租赁已从“可选补充”变为“刚需主力”。这一转变基于四个硬性约束。首先是合规卡脖子,受出口管制影响,H20、B200等高端卡自购额度极其有限,租赁成为获取合规算力的几乎唯一途径。其次是重资产压力,自建一个万卡集群需要一次性投入超过200亿元,且涉及拿地、能耗、漫长建设周期,而租赁可以按月付费,极大提升了资金使用效率。第三是需求弹性,大模型训练和智能体应用的需求呈脉冲式爆发,自建集群难以匹配波峰波谷,租赁则能实现快速扩缩容。因此,大厂普遍形成了“国产卡自购稳底座,海外高端卡租赁补弹性”的混合策略,租赁在高端算力领域已成为必选项。

4. 国内合同细节与盈利模型

2026年国内算力租赁合同的签订已形成清晰模式。对于H100、B200等大卡或大集群,标准合同是3年闭口锁价,并可选择附加2年弹性续约期。行业统一的成本回收周期约为3至3.5年,这涵盖了服务器成本、资金成本、电费、运维及带宽等全部支出。这意味着,只要能顺利执行完前3年合同,服务商就能收回全部硬性成本,从第4年开始的租金收入将几乎全部转化为利润,弹性巨大。在违约方面,随着2026年供给再度紧张,违约率已大幅下降。一旦头部大厂违约,面临的违约金可能高达数亿元,这维护了长单的稳定性。因此,对服务商而言,前3年是生存回本的关键期,之后便进入利润爆发期。

5. 国内外超大额长单差异的根源

海外出现CoreWeave累计878亿美元、Nebulas 270亿美元的超大额长单,而国内罕见类似规模订单,这背后存在结构性差异。海外是“巨头对巨头”的深度绑定,基于长期的信用和战略合作。国内则受限于几个因素:一是客户资本开支节奏更谨慎,倾向于分年度落地,而非一次性锁定未来8-10年的全部需求;二是服务商自身面临高端卡供给的高度不确定性,不敢承诺超长期的稳定大规模交付;三是只有头部上市公司或国央企背景的服务商,才能获得足够的低成本长期资金来支撑如此巨量的重资产承诺;四是政策风险敞口,海外GPU的供应政策存在波动可能。不过,国内头部服务商与大厂之间也已开始签订为期3-5年的“保量保价”框架协议,只是金额不会一次性全部曝光。

6. 超威事件后的高端卡供给危机

“超威事件”对国内高端算力供给造成了颠覆性影响,行业正式进入“有卡为王”的强卖方市场。事件发生后,全国范围内可用的B200/B300等大卡现货在极短时间内被抢购一空,甚至连尚未完成部署的算力集群也被高价锁定。更重要的是,新增供给渠道几乎被冰封,通过正规途径获取增量B卡变得异常困难。这种供给的骤然紧缩,使得定价权完全向持有现货或拥有稳定渠道的服务商倾斜。租金开始按月上调,头部客户为了获得稳定的算力供应,愿意支付更高的溢价。专家判断,这种高端卡的短缺局面将贯穿2026年全年,并可能延续至2027年,成为驱动今年算力租赁商业绩爆发的核心供给端逻辑。

7. 国内外利润率悬殊的真实原因

表面上看,海外龙头公司财报显示亏损,而国内头部企业却能实现10%-15%的净利率,这并非因为国内商业模式更优越,而是成本结构、会计处理和发展阶段不同所致。海外公司如CoreWeave,其硬件采购成本实际上低于国内,因为它们直接向英伟达拿货,链路最短。但其运营成本(如电价、地价、人工)远高于国内,且正处于极端激进的扩张期,将大量现金投入研发、销售和全球数据中心建设,这种“扩张性亏损”旨在抢占未来市场份额。反观国内,服务商普遍采用3年加速折旧法,在前3年合同期内就将硬件成本基本提足,后期成本压力骤减。同时,国内在电费、运维、土建等方面拥有显著成本优势。加之当前需求旺盛、租金上涨,早期以低价采购的存量服务器正在享受高价租金,利润空间被极大拉开。简言之,海外是牺牲短期利润换取未来规模和壁垒,国内则是在当前有利的市场结构和成本优势下兑现利润。

8. 当前市场租金与供需热度

2026年,全球算力租赁市场租金全线上涨,供需极度紧张。数据显示,海外市场H100的租赁价格在5个月内上涨了40%,新一代Blackwell系列芯片的价格在2个月内上涨了48%。国内市场同样火爆,H100、A100的月租金普遍突破5万元人民币,部分稀缺资源甚至达到6至6.6万元;H200的租金也有20%-30%的涨幅;而最先进的B200几乎处于“一卡难求”的状态,租金完全随行就市,大厂愿意为此支付显著溢价。在利用率方面,头部算力服务商的上架率超过90%,高端卡资源基本全部租罄,没有闲置。推动租金上涨的核心逻辑有两个:一是下游AI应用Token消耗量指数级增长,创造了真实需求;二是高端GPU供给被冻结,供需严重失衡,导致租金易涨难跌。

9. 成本上涨下的履约风险与行业洗牌

如果服务商在签订了3年闭口锁价合同后,遭遇芯片、光纤等硬件采购成本或电费大幅上涨,将陷入两难困境。现实中,他们只有两种选择:一是选择违约,支付巨额违约金(可能上亿元)并永久失去重要客户资格;二是咬牙履约,自行消化成本上涨,压缩利润甚至微利运营,指望在合同到期后的续约中挽回损失。2026年,这种风险正在加速行业洗牌。拥有大量早期低价卡库存的头部服务商,可以用存量资产的低成本优势来对冲新采购的成本压力。而那些没有库存、融资成本又高的腰部厂商,一旦在价格周期判断上失误,或被迫执行严重侵蚀利润的合同,就极易被淘汰出局。这使得行业集中度快速提升,强者恒强的格局愈发明显。

10. 业绩高增长的可持续性分析

以协创数据2026年Q1净利润暴增3-4倍为例,这种增长并非会计技巧或短期脉冲,而是由三个坚实逻辑支撑的、可持续性很强的趋势。第一是需求真实且持续爆发,大模型训练与AI智能体推理应用形成双轮驱动,算力供不应求。第二是租金水平持续上行,新签订的合同价格环比不断上调,同时存量低价合同仍在顺利执行。第三是低成本资产进入利润释放期,前期以较低价格采购的服务器、光模块等资产,现在正以高涨的市场租金对外提供服务,毛利率被急剧拉大。专家判断,只要高端GPU的供给没有大规模放开,2026年全年行业都将维持高景气,下半年利润率不仅不会下滑,甚至有可能继续走高。

11. 未来三年(2026-2028)行业景气度展望

综合判断,算力租赁在未来三年是一条确定性极高的黄金赛道,而非昙花一现的风口。需求端只会越来越强:全球主要AI公司日均Token消耗量已达百亿级别,多模态和智能体应用的普及将使推理需求达到训练需求的5-10倍,预计2026年中国算力租赁市场规模将达2600亿元,同比增长超20%。供给端则持续紧张:高端GPU出口管制难以放松,B200/H200等芯片在国内长期短缺;同时,上游光模块、DSP芯片以及光纤等也因产能问题存在缺口。基于此,行业终局路径逐渐清晰:2026年将是“涨价+放量”的双击之年,头部企业利润表极为亮眼;2027年,行业整合加速,中小厂商退出,市场向头部集中,价格趋稳但需求总量继续攀升;到了2028年,国产算力芯片有望开始规模放量,与海外高端卡形成“混合双打”的供给格局,行业将从超高增长、高利润阶段步入稳健增长阶段。本质上,算力租赁正在成为AI时代的基础设施,即“水电煤”。当前的核心竞争规则很简单:

谁能搞定稀缺的卡源、谁能扛住重资产投入、谁能绑定大厂的长单、谁能有效控制运营成本,谁就能赢得这场竞赛。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!