返回话题列表
乐晴行业观察
2026/04/12 22:53
类型 talk 5阅读 1

AI算力链更新:国产算力+大模...

发布者:乐晴

①梁文锋:DeepSeek V4 将4月下旬正式发布。

②算力租赁全面涨价,NBIS历史新高。

1)AI算力紧缺,继阿里、百度涨价后,腾讯也官宣涨价

以Opencalw为代表的AI应用迎来部署热潮,Token调用量激增,带动AI算力需求高增,各大智能云厂商相继涨价。

3月18日,阿里云官网发布公告,因全球AI需求爆发、供应链涨价,阿里云AI算力、存储等产品最高涨价34%。

其中,平头哥真武810E等算力卡产品上涨5%-34%,文件存储产品CPFS(智算版)上涨30%。同日,百度智能云也宣布对部分产品价格进行结构性优化。

公告称自4月18日起,AI算力相关产品服务的价格上调约5%-30%;并行文件存储等价格上调约30%。4月9日腾讯云发布产品价格调整公告,将于2026年5月9日起,对AI算力、容器服务及弹性MapReduce(EMR)相关产品刊例价进行调整。AI算力相关产品服务:上调5%;容器服务TKE-原生节点相关产品服务:上调5%;弹性MapReduce(EMR)相关产品服务:上调5%。

2)国产AI加速卡崛起,市场份额有望进一步提升

在推理侧算力需求高速增长的背景下,国产AI芯片份额快速提升。根据IDC最新报告,2025年中国云端AI加速器市场,中国本土芯片厂商拿下近41%的份额,总出货量高达约165万张。从各家出货量来看,华为以约81.2万颗的出货量领跑,平头哥增速迅猛跃居次席,昆仑芯、寒武纪并列第三,海光信息、沐曦、天数智芯出货量稳居前列。

2026年以来,华为发布了搭载全新昇腾950PR(Ascend 950PR)处理器的AI训练推理加速卡Atlas 350,在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升。寒武纪也将推出新一代AI加速卡MLU690,随着国产AI加速卡性能快速提升,市场份额也有望进一步提升。

AI算力紧缺的背景下,国产算力迎来新机遇。

逻辑很直接:DeepSeek等国产模型都在适配国产芯片,市场一直的预期是国产模型不好用,国产芯片适配难。随着国产模型的突破,算力的供不应求,以及国产卡的进展,整个国产链的正循环就开始了。

短期的发酵就是:产业链都在对算力加单,对国产卡上修。

这周跑了一些公司,产业的反馈都很好。比如海光对出货的指引很硬;芯原的订单也很多;算租的价格又上涨10%;h的出货量大幅上修。相关:芯片(海光 寒武纪 芯原 天数),h(电器、杰华特),租赁(利通、盈峰)等。

事件:本周某大厂B300集群租赁长单价格涨价10%,整体对应单一集群利润提升1.5亿/年。H100目前1年期租约价格已经上涨至9万/月,美股NBIS新高。

涨价后如何测算盈利能力:

- 租赁价格:取15万/月,年租金180万(另有部署激励)

- 现金流成本端相对固定:年度机柜+电费+财务费用成本约36万

- 折旧:目前B300采购价格取决于渠道,不同渠道采购价格差距较大,NCP渠道采购品牌机成本约310万人民币,NCP代采需要410万,现货540万,整体配套100万

- 净利润(全成本税后):NCP拿卡渠道每1000台B300净利润约为6.5亿,代采期货渠道净利润约为4.9亿,现货渠道净利润约为3.5亿。

行业整体盈利能力大幅提升,目前NV系列高端服务器盈利能力堪比金矿,有望迎来戴维斯双击,估值EPS同步提高,进入主升。

重点关注拿卡能力与弹性兼具的核心

① 利通电子:目前市值190亿,NCP渠道,目前年化利润12亿,单B300集群利润能见度6.5亿,目前与东阳光合作,东阳光出钱,利通买卡(利通分成20%)。

② 盈峰环境:目前市值324亿,通过NCP代买渠道,购买4,000台建设集群。

③ 行云科技:目前市值107亿,NCP渠道,目前已锁定2,000台B300建设集群。

各位领导好,我们已于近期的周观点中持续强调了对国产算力的强烈看好。

基本面上看,国产大模型和GPU互相促进的正循环已经启动,大模型调用量持续攀升。

目前下游缺卡是常态,卡点在产能而非需求,因此最近大家看到的一些认为GPU和自研ASIC在互相挤占的逻辑不成立(因为都很缺),这也是我们去年12月以来关注芯原的原因(产能侧通畅)。

情绪面看,中芯华虹和寒武纪的反弹是一个积极信号,反映资金确实在buy in筹码干净、短期有DeepSeek V4发布催化预期、中长期成长趋势确定的国产算力板块。我们在几大龙头股价左侧的时候看多国产算力,在右侧的时候就更为乐观了。

后续建议各位领导关注以下催化:主要GPU芯片的良率进展,互联网厂商的资本开支计划,Deepseek模型创新。

始于去年底,财通电子&新科技继续板块性看多国产算力!重视国产算力三剑客(芯原+伟测+华丰)。

数据端:25年国内AI芯片总出货量超400万,英伟达市占率下降至55%,华为第一、平头哥第二、昆仑芯&寒武纪其次。

能力端:超节点网络拓扑、互联协议、机柜设计已有标准方案。

国产算力进入单卡-系统交替技术突破贡献效率提升的周期,未来LPO/CPO/OCS、HBM/3D DRAM、Infra技术的突破都可能带来效率提升。

大模型持续更新:

Claude Mythos引发关注讨论,标志着AI开始在网络安全领域具备规模化攻防能力。

DeepSeek V4灰度测试,补齐多模态能力,此外预期推理和代码能力继续升级、长上下文和Agent提升、国产算力适配,技术架构延续DSA+MoE,有望运用Engram和DualPath。

浪潮信息:Token经济快速发展正在将算力服务器推向产业核心。

聚水潭深度:盈利拐点已现,规模化+AI+出海驱动未来增长。

本周国产算力整体大幅反弹,背后体现的主要是大盘企稳后的beta修复。

节前火山引擎公布豆包大模型日均 Token 使用量突破 120 万亿,相较3个月前翻倍。市场对于字节缺卡预期再次加强。

业绩层面,本周海光信息披露Q1财报,实现收入40.3亿元,yoy+68.06%,实现归母净利润6.87亿元,yoy+35.82%。整体来看符合公司业绩预告区间。资产负债方面,公司26Q1存货/预付款达到73亿元/34亿元,与25年Q1~Q4四个单季度相比,均有明显抬升。我们看好海光的重要抓手在于,公司是国产AI芯片厂商中最先稳定输出业绩兑现的公司,且2026年会是CPU与DCU在业绩端双轮驱动的大年,产能端也很有保障。

我们认为是产业趋势的必然,不过是迟或早的问题。当下继续关注国产超节点机会,尤其是Switch芯片环节盛科通信、中兴通讯、海光信息等。

下周4/14日关注郑州线下中科曙光AI4S计算集群发布会。

国产算力五大天王:海光信息 寒武纪 | 芯原股份 | 盛科通信 | 兆易创新,以及灿芯股份、翱捷科技等。

1)高端算力卡需求大增:AI应用token消耗量巨大,高端英伟达卡在训练/推理上性价比优势明显,需求刚性。大厂和大模型厂商加价抢购。

2)供给格局收缩,持续涨价。高端N卡供给有限。同时行业壁垒高,算力租赁格局向头部集中,核心算力租赁供应商呈现“缩圈”态势,租金价格持续上升。

3)商业模式升级,从卖算力到卖token。传统模式算力租赁公司签长协合同,销售算力。现在算力即收入,算力租赁商有望与模型厂商实现token分成,估值逻辑有望从PE切换至PS,市值空间打开。

4)盈利能力大幅提升。涨价、商业模式升级叠加融资利率优化,算力租赁公司盈利能力有望大幅提升。

供需缺口加大,行业缩圈,盈利能力提升,商业模式升级将估值从PE切换至PS,算力租赁行业有望迎来EPS和估值双重提升。相关:宏景科技,协创数据,利通电子,盈峰环境。

风险提示:中美地缘政治风险。

1)北美算租(coreweave、nebius)盈亏平衡点快到了(之前缺人缺电投太快),验证商业模式。

2)已经验证每次卡的迭代周期很长,提升幅度有限,所以今天A卡还租的价格不错。

3)国内认真做事公司已经有卡有利润(加速兑现,今年有的5年内还有,也可新增)。

4)前几年国内需求差,现在需求爆炸。

5)没有合规风险,国内上市公司都不碰非合规环节。供参考

算力租赁行业近期交流预期差更新

这两天参加AI算力论坛,虽然讲的都是咱们老生常谈的行业逻辑,但是了解到更多新细节与新变化以及新催化,使得我对今年算力的跟踪和看好,更加有底气与信心。

会上很多专家吐槽最近DeepSeek和智谱等大模型因缺算力出现半瘫痪,算力涨价与紧缺要持续到27年,算力租赁公司给腾讯这种大厂交付算力都是万卡集群起步,起步都是 5 年,而且好几个专家认为之前新能源补贴,到现在的先进制程补贴,再到将来还可能会轮到AI行业,所以大爆发的时候还没到,虽然我们底部提示的算力租赁翻倍了新高了,但可能也才刚开始。

这就是我们机构景气度趋势投资要找的瓶颈环节,而且是大众最容易懂最容易形成催化与共识的环节,顺着算力紧缺,去挖国产算力链条业绩放量,去炒海外算力新技术导入,这是今年最不容易出错的主线。

现在基本上各种公司人均配置不断进化的AI,生产力和算力倒挂日益严重,涨价新闻频传,相信这是大家看得见摸得到并深有体会的事情,那今天我就结合这两天与各专家的交流,从算力租赁这个最直接反应算力供需的行业为例,给大家讲讲今年以来算力租赁的积极变化以及未来可见的行业催化,看懂大方向后,整个算力链条的景气和业绩释放节奏大家也会更加清晰。

算力租赁核心资源:算力租赁是基于AI算力云业务的商业模式,用户可按月/年租用计算资源(以海外高端英伟达N卡AI芯片为主);

算力租赁厂商25年之前以H系列芯片为主,到25年与今年,向B200、B300等更先进、推理性价比更高的芯片集群切换,是当前AI产业能解燃眉之急的核心环节,所以今年地位非常之高,因为中国最先进模型的训练和推理依赖算力租赁厂商提供的英伟达高端算力,合规性要求高的大厂难以通过非合规方式获取先进芯片,且倾向于选择最先进的算力芯片进行租赁合作,以应对潜在风险并提升服务质量,将大额姿本支出(如H100集群30亿、B200集群40亿人民币)转为小额运营支出,平滑现金流,改善姿本开支结。

需求驱动因素:AI Agent(多模态、coding等)应用落地,Token消耗量大幅增加:传统文本推理仅300Token,自动订票需5000-15000Token(十倍以上增长),分析4K截图/5秒视频需2000-8000Token。2026年元旦后全球头部模型Token调用量陡峭增长,中国模型因性能提升、电力与算力成本优势,Token性价比高,在OpenRouter调用量排名靠前,连续五周超越美国,过去一年周度消耗Token数量从2.1T上升至24.5T,2026年以来周度Token消耗增加280%,Token出海趋势显著,国内算力需求旺盛。

供给与行业格局:美国4大云厂亚马逊微软谷歌meta25/26年资本开支合计达4002/6500亿美元,而中国字节阿里腾讯百度的资本开支仅为507.16/669.71亿美元,过去两年国内资本开支严重不足。当前高端N卡供不应求,头部云厂仅能拿到充足N卡,二线云厂、大模型公司需求缺口大;阿里云coding plan限购(仅固定时间可购买)、昨晚腾讯云也上调云服务价格。而且算力租赁行业供给有限(存在供应链风险),格局还在向头部集中,2026年Q1参与厂商较2025年Q1明显减少,主要源于以下的行业壁垒。

行业壁垒:首先是稳定拿卡能力与交付速度,客户以万卡集群为单位采购,要求同一厂商供应,交期需5个月内完成上线(否则罚款),2025年部分公司因拿不到卡未完成交付退出行业,而龙头公司渠道多元化,不受超威事件影响,且溢价拿到的服务器可向下游大厂涨价传导成本,再由大厂转嫁到用户,所以马太效应强者恒强;其次是组网调优能力。

不是说拿到卡就结束了,它还有很多的包括配件的配置,还有包括服务器上线后万卡集群的组网,因为现在除了算力服务器以外,像存储,像网卡这些跟组网紧相关的很多配件都是非常紧缺的,这些也是要算力租赁公司能够自己稳定去搞定的;资金周转能力,宏景科技2026年新增授信额度500亿,协创数据1000亿,所以大家看得到很多公司它的订单规模是非常大的,需求不断加大带来越来越大的订单规模,需要很强的资金周转能力和姿金实力来完成整个订单的获取和交付,所以整个来看算力租赁行业它的壁垒是越来越高的,于是它的紧俏程度和后面我们带来的涨价是顺理成章。

算力租赁以往的传统商业模式:签订3-5年合同,在5个月左右验收合格后上线计费,按月收取租金,所以他其实就为什么很多算力租赁公司,大家觉得去年订单很多,业绩还没有体现。因为它是有个交期的,所以这些算力租赁公司会在2026年Q1开始逐步季度去体现它的业绩。2026年Q1开始逐步体现业绩,且每个季度业绩会大幅同环比提升,是非常快和惊人的,所以2026年是非常重要的一个年份。

算力租赁新的商业模式:这是参会后我认为市场还没意识到的一个预期差,原先大家都觉得算力租赁公司是一个非常差的垫姿商业模式,其实在当前的这个Token非常缺,需求非常大的时代,算力租赁公司的一个商业模式将会迎来一个非常大的升级。那就是从裸算力出租向模型服务/Token分成模式升级,现在无论是智谱还是阿里,它的Codingplan是限售的,因为它算力不够,不是说你模型厉害你就能赚钱,而是你需要有算力。

对于算力租赁公司来说,我给你算力,就是相当于给大厂收入,那算力租赁公司将来可能会介入到他的Token分成中去,就说大厂每卖一些Token出去,那有一部分钱是要给算力租赁厂商的。那这样的话这种情况下,它的一个整个的盈利能力会大幅提升,估值会从当前的PE(盈利)要往PS(收入)去切换。这些算力租赁公司它的一个市值空间将会大幅的打开。

这些头部的算力租赁公司都已经开始跟中国头部的模型公司开始谈这种商业模式了,这个事情同时也在美国也在发生,中国市场落地也会很快。

盈利提升逻辑:租金大幅上升(供需紧张下议价权强),SemiAnalysis数据显示,算力租赁价格呈现上涨趋势,海外H100租赁价格5个月内上涨40%。算力租赁行业当前的高景气度主要源于国内优质算力的供不应求;财务费用降低,按照会计准则,五年折旧账面残值15%,但五年前的卡现在还在用,甚至今年价格还在涨,所以残值冲回其实是能来到70%的,而且银行认可算力姿产实际残值,所以算力设备折旧期满潜在的残值重估对算力租赁公司利率下降,财务成本还会收缩;Token分成模式强化租金收入,行业净利率从15%向20%甚至更高区域靠近,有望实现EPS与PE双击。

1)Anthropic:

--ARR达$300亿+,首超OpenAI

--发布Claude Mythos Preview,网络安全能力远超现有模型:因模型风险过高暂不公开,仅通过Project Glasswing向约50家机构开放,配套1亿美金额度,超出额度后按照Opus4.6的5倍定价收费

--即将推出新Claude Opus模型,作为Mythos公开前的过渡方案

--与谷歌、博通签下最新协议:共同打造GW级下一代TPU算力集群,预计2027年起陆续上线

--密集发布三项重大更新:Cowork 全面开放、Advisor 策略上线(Opus+Sonnet/Haiku 配对降本 11.9%)、Managed Agents API 发布(Agent 上线周期缩至数天,计费包括 Token 费用+按实际运行时间计费)

--推出 Claude Opus 4.6-fast模式:使用相同Opus 4.6模型,但速度提升2.5倍,定价为Opus 4.6普通模式6倍

2)OpenAI

--OpenAI 调整订阅体系,核心变化为 Codex 用量:Pro 档位定价修改为$100/月(此前为$200/月),价格与Claude Max档位一致,Codex 用量为Plus5 倍

--企业收入目前占40%,预计在2026年底与消费者端收入达到同等水平;Codex 用户突破 300 万

--新模型Spud可能将在几周内发布

--GPT Image 2 疑似泄露,Hive AI 检测显示某些生成样本仅1% 被识别为 AI 图像

3)Gemini:

--上线离线语音转文字应用Google AI Edge Eloquent,切入AI 语音转文字赛道:基于最新Gemma 架构,主打“离线优先”与“智能润色”

--Gemini应用中推出Notebooks功能:与Notebook LM深度集成,可与Notebook LM双向同步知识库、调用其特色功能

4)通义:

--百炼 MaaS 平台上API日均Token消耗规模提升6倍(2025.12-2026.03),预计商业化 MaaS 收入将会成为阿里云最大收入产品

--Qwen3.6 Plus 以 6.09T tokens 登顶OpenRo。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!