返回话题列表
乐晴行业观察
2026/04/16 08:51
类型 talk 12阅读 1

AI链更新:大模型+算力租赁 ...

发布者:乐晴

①4月15日,阿里云公告上调部分 MU(Model Unit)模型单元服务价格。

②谷歌发布Gemini 3.1 Flash TTS,实现情境导向语音合成。

阿里云公告,为保障底层硬件稳定供应、提升平台运维服务质量,并应对算力市场成本变化,将对大模型服务平台百炼部分MU(Model Unit)模型单元的服务价格进行适度调整:

影响产品:大模型服务平台百炼

上调幅度:2%-7%不等

今年3月18日阿里云刚刚宣布对AI算力及存储产品进行大幅调价 (真武810E等算力卡上涨5%-34%,CPFS智算版上涨30%),百度云同日跟进涨价5%-30%,4月初腾讯云也官宣AI算力产品涨价5%。本次阿里云进一步上调百炼MaaS平台定价,是今年以来国内云厂商的又一次提价动作,token需求持续爆发正在倒逼云服务全链条涨价,继续看好算力量价齐升趋势。

航天电器、东阳光、豫能控股、寒武纪、盛科通信、东方国信等

财通计算机 李康桥/王妍丹

4 月 15 日,阿里云公告上调部分 MU(Model Unit)模型单元服务价格,理由是为了保障底层硬件稳定供应、提升运维质量,以及 应对算力市场成本变化 ;再往前看,阿里云百炼的 Coding Plan 从早期提供 40 元/月的 Lite廉价版,到 3 月 20 日起停止新购,只提供 200 元/月的 Pro版,再次说明了#token的紧缺和token价值量提高的趋势 。

此外,智谱MiniMax 调整,经我们调研并没有产业和技术上的利空,猜测或许是和DeepSeek V4将发布有关。但是我们再回想下每次DeepSeek的发布,都会为开源软硬件算法持续添砖加瓦,国产模型的开源生态只会相互繁荣,而不是你死我活。

大模型产业趋势未变,看好模型价值提升和token放量双击 。

3月底起,强call以hwj为首的国产Gpu,核心原因是agent ai下国产tokens大爆发,预计#“加单”会成为年度关键词,后续需求缺口会近一步扩大。今天阿里云宣布部分MU模型上调价格2%-7%,是一个月内的第三次调价。

hwj,我们认为不用等待一季报,当下就是最好窗口。

By Txy

Hermes Agent是一个自进化、全模型兼容、多平台、带长期记忆的AI智能体框架。该开源项目在GitHub上线2个月达到8.6万+Star(截止4月15日)。HermesAgent是由NousResearch发布,已经获得了来自Paradigm领投的5000万美元投资。

OpenClaw V.S. Hermes:Hermes有记忆能力,会跟随使用者成长,同样的场景无需再教。核心技能:Skills闭环系统。它实现了一个完整的 "经验提取 → 知识存储 → 智能检索 → 上下文注入 → 执行验证 → 自动改进" 闭环。Skills 系统让 AI Agent 像人类专家一样积累经验——把成功的做法写成标准程序,在使用中持续修订,并且可以分享给其他人。Hermes可以获得OpenClaw直接迁移过来的记忆、API Key、Skills。

OpenClaw和Hermes的不断出圈意味着AI Agent正从概念走向规模化商用,其自主任务执行、长周期推理、多工具循环调用的特性,彻底重构算力消耗逻辑 —— 从传统 Chatbot 的 “单次对话、瞬时消耗”,转为 “计划 - 执行 - 反馈 - 迭代” 的持续高负载、指数级 Token 消耗。相关投资机会:

1)Agent越来越好用,直接引爆全球算力需求,形成训练 + 推理双爆发、全产业链量价齐升的超级景气周期。关注算力产业链:海光信息、寒武纪、协创智能、杰创智能、澜起科技、工业富联、中科曙光、智微智能、润泽科技、东方国信等。

2)模型调用量提升,Token指数级增长,模型收入有望创新高。关注阿里巴巴、智谱、minimax、卓越睿新等。

3)智能升级带动企业级AI应用发展,关注金山办公、国能日新、道通科技、中控技术、汉得信息、美图公司等。

风险提示:模型迭代不及预期、算力供应不及预期、国产替代不及预期等。

业绩释放期,token分成模式增加利润

协创数据26Q1净利预增284%-402%,打响算力租赁利润兑现第一枪。海外高端GPU租金持续涨价,行业正从硬件转租向Token服务升级,头部厂商估值逻辑迎切换。

国内资本开支爆发,算力租赁持续受益

算力租赁是CSP厂商将资本开支(Capex)转化为运营开支(Opex)趋势下的重要方向。具备渠道拿卡能力与金融杠杆优势的企业,在缺卡行情中充分受益,算力租赁在整体资本开支中的份额亦在不断提升。

-协创数据:算力租赁业绩龙头,全年800亿订单目标可期,处于业绩与估值共振的爆发阶段。

- 宏景科技:交付优势突出,订单确定性高,全年有望实现500亿订单。

- 智微智能:全年业绩展望约6亿元,季度业绩节奏持续高增,兼具“服务器卖水人”与LPU双重逻辑。

算力租赁当前不仅要关注“量变”,更要关注“质变”。

量变:token需求旺盛,2026年Q1算力租赁订单需求已经是2025年全年2倍以上,客户需要依旧大量无法满足。

质变:商业模式重大升级,从卖算力到卖token。对于大模型公司,算力即收入。算力租赁公司手中的高端NV算力可以产生优质token,性价比极高。算力租赁公司议价权显著提升,token分成商业模式正在形成。估值将从PE切换到PS。

算力租赁门槛变高,聚焦算力租赁头部玩家,在“量变”趋势中掌握核心算力资源,在“质变”趋势中率先实现商业落地。

宏景科技;其他头部玩家:协创数据,盈峰环境,利通电子。

风险提示:中美地缘政治风险。

东吴计算机王世杰

算力租赁:2025-2026年国内算力扩充的“最优选”

定义:以裸金属GPU租赁为核心,用户可直接访问GPU芯片,避免虚拟化性能损耗。相较传统云厂商提供更高计算密度,但对用户技术能力要求较高。

商业模式:通常以“3+2”为主要合作模式,签署五年期租赁合同。以 “每签约 GPU 每小时” 为计价单位,合同期内价格固定,每月按客户预留的使用承诺计费;客户通常在签约时支付预付款(15-25%)

景气度:智谱、腾讯云等再次上调算力服务价格、供应链整体涨价

Seedance和Nano Banana发布推动Token吞吐量的大幅增长。2026年3月豆包大模型日均Token(词元)调用量已于突破120万亿,三个月增长一倍。Anthropic年度经常性收入(ARR)一个季度翻三倍、超过300亿美元。

4月8日智谱发布GLM-5.1、模型价格再度提高10%;4月9日,腾讯云也再度涨价。当前全球算力租赁行业维持高度景气,H200/B200租赁价格持续刷新历史新高。我们认为,#GPU租赁行业供需格局将持续紧张,量价齐升趋势明确。

相关:协创数据、宏景科技、盛视科技、利通电子、盈峰环境...

近期催化:

一、近大模型商业化进展快:

OpenAI同步推进B/C端商业化:2030年预计广告收入1020亿美元;B端收入占比超40%,预计今年与C端收入持平。

AnthropicARR达300亿美元,超过OpenAI;近期将企业客户定价从按席位转向按实际AI使用量计费。

后续催化:

1、腾讯混元、DS-V4有望发布。

2、年中原动力大会字节将推出大模型版本更新。

3、海内外头部大模型的密集更新及商业化落地。

AI应用标的目前回调至启动前的低点,商业化及应用层催化不断,重视AI应用机会。

哔哩哔哩、汇量科技、易点天下。其他:昆仑万维、焦点科技、引力传媒;上海电影、华策影视等。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!