AI链更新:大模型+算力租赁 ...
发布者:乐晴
①4月15日,阿里云公告上调部分 MU(Model Unit)模型单元服务价格。
②谷歌发布Gemini 3.1 Flash TTS,实现情境导向语音合成。
阿里云公告,为保障底层硬件稳定供应、提升平台运维服务质量,并应对算力市场成本变化,将对大模型服务平台百炼部分MU(Model Unit)模型单元的服务价格进行适度调整:
影响产品:大模型服务平台百炼
上调幅度:2%-7%不等
今年3月18日阿里云刚刚宣布对AI算力及存储产品进行大幅调价 (真武810E等算力卡上涨5%-34%,CPFS智算版上涨30%),百度云同日跟进涨价5%-30%,4月初腾讯云也官宣AI算力产品涨价5%。本次阿里云进一步上调百炼MaaS平台定价,是今年以来国内云厂商的又一次提价动作,token需求持续爆发正在倒逼云服务全链条涨价,继续看好算力量价齐升趋势。
航天电器、东阳光、豫能控股、寒武纪、盛科通信、东方国信等
财通计算机 李康桥/王妍丹
4 月 15 日,阿里云公告上调部分 MU(Model Unit)模型单元服务价格,理由是为了保障底层硬件稳定供应、提升运维质量,以及 应对算力市场成本变化 ;再往前看,阿里云百炼的 Coding Plan 从早期提供 40 元/月的 Lite廉价版,到 3 月 20 日起停止新购,只提供 200 元/月的 Pro版,再次说明了#token的紧缺和token价值量提高的趋势 。
此外,智谱MiniMax 调整,经我们调研并没有产业和技术上的利空,猜测或许是和DeepSeek V4将发布有关。但是我们再回想下每次DeepSeek的发布,都会为开源软硬件算法持续添砖加瓦,国产模型的开源生态只会相互繁荣,而不是你死我活。
大模型产业趋势未变,看好模型价值提升和token放量双击 。
3月底起,强call以hwj为首的国产Gpu,核心原因是agent ai下国产tokens大爆发,预计#“加单”会成为年度关键词,后续需求缺口会近一步扩大。今天阿里云宣布部分MU模型上调价格2%-7%,是一个月内的第三次调价。
hwj,我们认为不用等待一季报,当下就是最好窗口。
By Txy
Hermes Agent是一个自进化、全模型兼容、多平台、带长期记忆的AI智能体框架。该开源项目在GitHub上线2个月达到8.6万+Star(截止4月15日)。HermesAgent是由NousResearch发布,已经获得了来自Paradigm领投的5000万美元投资。
OpenClaw V.S. Hermes:Hermes有记忆能力,会跟随使用者成长,同样的场景无需再教。核心技能:Skills闭环系统。它实现了一个完整的 "经验提取 → 知识存储 → 智能检索 → 上下文注入 → 执行验证 → 自动改进" 闭环。Skills 系统让 AI Agent 像人类专家一样积累经验——把成功的做法写成标准程序,在使用中持续修订,并且可以分享给其他人。Hermes可以获得OpenClaw直接迁移过来的记忆、API Key、Skills。
OpenClaw和Hermes的不断出圈意味着AI Agent正从概念走向规模化商用,其自主任务执行、长周期推理、多工具循环调用的特性,彻底重构算力消耗逻辑 —— 从传统 Chatbot 的 “单次对话、瞬时消耗”,转为 “计划 - 执行 - 反馈 - 迭代” 的持续高负载、指数级 Token 消耗。相关投资机会:
1)Agent越来越好用,直接引爆全球算力需求,形成训练 + 推理双爆发、全产业链量价齐升的超级景气周期。关注算力产业链:海光信息、寒武纪、协创智能、杰创智能、澜起科技、工业富联、中科曙光、智微智能、润泽科技、东方国信等。
2)模型调用量提升,Token指数级增长,模型收入有望创新高。关注阿里巴巴、智谱、minimax、卓越睿新等。
3)智能升级带动企业级AI应用发展,关注金山办公、国能日新、道通科技、中控技术、汉得信息、美图公司等。
风险提示:模型迭代不及预期、算力供应不及预期、国产替代不及预期等。
业绩释放期,token分成模式增加利润
协创数据26Q1净利预增284%-402%,打响算力租赁利润兑现第一枪。海外高端GPU租金持续涨价,行业正从硬件转租向Token服务升级,头部厂商估值逻辑迎切换。
国内资本开支爆发,算力租赁持续受益
算力租赁是CSP厂商将资本开支(Capex)转化为运营开支(Opex)趋势下的重要方向。具备渠道拿卡能力与金融杠杆优势的企业,在缺卡行情中充分受益,算力租赁在整体资本开支中的份额亦在不断提升。
-协创数据:算力租赁业绩龙头,全年800亿订单目标可期,处于业绩与估值共振的爆发阶段。
- 宏景科技:交付优势突出,订单确定性高,全年有望实现500亿订单。
- 智微智能:全年业绩展望约6亿元,季度业绩节奏持续高增,兼具“服务器卖水人”与LPU双重逻辑。
算力租赁当前不仅要关注“量变”,更要关注“质变”。
量变:token需求旺盛,2026年Q1算力租赁订单需求已经是2025年全年2倍以上,客户需要依旧大量无法满足。
质变:商业模式重大升级,从卖算力到卖token。对于大模型公司,算力即收入。算力租赁公司手中的高端NV算力可以产生优质token,性价比极高。算力租赁公司议价权显著提升,token分成商业模式正在形成。估值将从PE切换到PS。
算力租赁门槛变高,聚焦算力租赁头部玩家,在“量变”趋势中掌握核心算力资源,在“质变”趋势中率先实现商业落地。
宏景科技;其他头部玩家:协创数据,盈峰环境,利通电子。
风险提示:中美地缘政治风险。
东吴计算机王世杰
算力租赁:2025-2026年国内算力扩充的“最优选”
定义:以裸金属GPU租赁为核心,用户可直接访问GPU芯片,避免虚拟化性能损耗。相较传统云厂商提供更高计算密度,但对用户技术能力要求较高。
商业模式:通常以“3+2”为主要合作模式,签署五年期租赁合同。以 “每签约 GPU 每小时” 为计价单位,合同期内价格固定,每月按客户预留的使用承诺计费;客户通常在签约时支付预付款(15-25%)
景气度:智谱、腾讯云等再次上调算力服务价格、供应链整体涨价
Seedance和Nano Banana发布推动Token吞吐量的大幅增长。2026年3月豆包大模型日均Token(词元)调用量已于突破120万亿,三个月增长一倍。Anthropic年度经常性收入(ARR)一个季度翻三倍、超过300亿美元。
4月8日智谱发布GLM-5.1、模型价格再度提高10%;4月9日,腾讯云也再度涨价。当前全球算力租赁行业维持高度景气,H200/B200租赁价格持续刷新历史新高。我们认为,#GPU租赁行业供需格局将持续紧张,量价齐升趋势明确。
相关:协创数据、宏景科技、盛视科技、利通电子、盈峰环境...
近期催化:
一、近大模型商业化进展快:
OpenAI同步推进B/C端商业化:2030年预计广告收入1020亿美元;B端收入占比超40%,预计今年与C端收入持平。
AnthropicARR达300亿美元,超过OpenAI;近期将企业客户定价从按席位转向按实际AI使用量计费。
后续催化:
1、腾讯混元、DS-V4有望发布。
2、年中原动力大会字节将推出大模型版本更新。
3、海内外头部大模型的密集更新及商业化落地。
AI应用标的目前回调至启动前的低点,商业化及应用层催化不断,重视AI应用机会。
哔哩哔哩、汇量科技、易点天下。其他:昆仑万维、焦点科技、引力传媒;上海电影、华策影视等。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!