返回话题列表
乐晴行业观察
2026/03/12 08:39
类型 talk 10阅读 1

云计算+大模型+OpenCla...

发布者:乐晴

①英伟达宣布向AI数据中心专业公司Nebius投资20亿美元,将帮助Nebius在2030年底前部署超过5吉瓦的算力容量,Nebius涨16.14%。

②腾讯云宣布AI模型涨价400%。

②OpenClaw:超算互联网向每位OpenClaw用户免费发放1000万Tokens;华为推出“鸿蒙版龙虾”小艺Claw;腾讯版“小龙虾”WorkBuddy正式支持后台自动化任务。

③OpenClaw安全:腾讯龙虾数据安全保护Skill上架ClawHub;券商密集针对“小龙虾”OpenClaw下发内部合规提醒或相关通知;工业和信息化部网络安全威胁和漏洞信息共享平台发布关于防范OpenClaw(“龙虾”)开源智能体安全风险的“六要六不要”建议。

④隔夜中概云厂商金山云跌3.97%。

OpenClaw2025年11月在GitHub发布后迅速走红,在4个月内星标突破25万,从技术上来看, OpenClaw能够拆解任务、联网搜索、调用本地软件、自我纠正重试并向云端大模型发送请求,其多轮自我修正和庞大上下文的特性意味着Token消耗量面临指数级增长。

OpenClaw快速出圈或将驱动AI云算力持续增长。

据行业监测,2026年开年AI算力需求激增驱动算力租赁市场进入涨价周期。

截至2月底,英伟达H200、H100等高端GPU租金环比上涨15%-30%,H200时租达7.5-8.0元/卡时,月租6.0-6.6万元,涨幅25%-30%;H100月租涨至5.5-6.0万元,涨幅15%-20%。

交付周期延长至2027年Q2(H200)与Q1(H100)。头部厂商优刻得、森华易腾等已官宣3月全线涨价20%-30%。

OpenClaw的发展或大幅提升对于AI云IAAS的需求,AIDC、算力租赁、CDN作为AI云IAAS的核心组成。

相关再梳理(不构成投资建议):

AIDC机房:光环新网、大位科技、奥飞数据、新意网集团、润泽科技、宝信软件;东阳光、数据港、万国数据、世纪互联等;

AIDC液冷:英维克(液冷全链条全自研龙头);申菱环境、远东股份、飞龙股份、银轮股份、同飞股份、网宿科技、高澜股份等;

AIDC供电:中恒电气、科泰电源、潍柴重机等;

算力租赁:景科技、协创数据、智微智能、首都在线、润建股份、中贝通信、航锦科技等;

CDN:网宿科技等;

AIDC计算和网络:华工科技、盛科通信、中际旭创、新易盛、亨通光电、中天科技、中兴通讯、紫光股份、欧陆通、天孚通信;受益标的:寒武纪、海光信息、华勤技术、浪潮信息、锐捷网络、长飞光纤光缆、长飞光纤、烽火通信、永鼎股份、远东股份、罗博特科、炬光科技、致尚科技、杰普特等。

开源证券通信团队

核心围绕海外用户调用国内大模型API的技术架构、市场策略、成本与性能对比等关键问题展开。以下是详细内容总结:

一、技术架构与算力部署:分层混合模式

国内大模型公司服务海外用户时,普遍采用“应用层海外,推理层国内”的混合架构。

应用/展示层(海外部署):

位置: 主要部署在新加坡节点,也会利用东南亚周边及部分国内基建。

功能: 处理用户直接访问(官网、第三方平台)的请求、市场营销、用户界面展示等。

算力类型: 主要使用CPU通用算力,成本较低,无需大量GPU资源即可支撑海外访问流量。

模型推理层(国内部署):

位置: 主要调用国内数据中心的算力进行实际的大模型推理计算。

原因: 成本优势是国内模型出海的核心竞争力。国内推理算力(如使用消费级显卡RTX 5090等)成本远低于海外高端算力(如H200)。

时延影响: 由于大模型推理本身耗时较长(约100多秒),网络传输增加的时延相对影响不大,在可接受范围内。

数据合规与流转:

数据性质: 强调处理的是“任务相关的上下文数据”,而非用户原始隐私数据(如邮箱密码)。这些数据多与代码生成等场景相关,本身在互联网上可获取,敏感性较低。

合规处理:

通过用户协议事先告知用户数据可能用于国内推理。

数据会进行脱敏处理。

用户隐私数据主要保存在用户本地或海外应用服务器,不传输至国内。

监管风险: 认为当前做法符合海外监管要求,因为监管主要针对原始个人隐私数据的跨境转移。

二、 市场策略与增长驱动

增长逻辑: 国内大模型在海外(特别是通过OpenRouter等平台)的调用量(Token消耗)自2025年初的约2%占比,已显著增长至近期高点(曾超60%,后回落至约39%)。这主要源于海外用户寻求高性价比的API替代方案,尤其是自2024年底“小龙虾”(Crawfish,指代某类AI助手产品)等AI应用火爆后,流量加速向价格更优的国内模型迁移。

营销周期:

新模型发布时会进行营销推广,带来1-2周的流量高峰。

高峰期后流量会逐渐回落。若没有持续的模型更新或新功能,市场份额可能被其他模型切走。

长期增长依赖于扎实场景的落地,如代码生成(Coding)和个人AI助理,这些场景正在推动Token消耗的实质性上升。

竞争格局:

创业公司(如Minimax、智谱、Kimi等): 普遍采用上述混合架构,并建立了独立的海外平台进行品牌运营和推广。

国内互联网大厂(如豆包、通义千问): 目前更多面向国内市场,尚未大规模推出独立的海外品牌和平台。

三、 模型性能、成本与国产芯片

性能差距: 国内模型在代码生成等特定领域,通过知识蒸馏等技术,能逼近海外领先模型(如GPT-4.5水平),但存在约3个月的代际时间差。

成本优势: 国内模型API价格约为海外模型的1/5到1/6。这主要得益于:

使用成本更低的国产算力卡或消费级显卡(如RTX 5090)进行推理。

国内电力等基础设施成本较低。

国产芯片挑战:

稳定性不足: 与英伟达芯片(如H200)相比,国产芯片(如华为)在长时间稳定运行任务方面仍有差距,可能仅能稳定运行数分钟。

生态劣势: 英伟达的CUDA生态积累了巨大优势,国产芯片短期内难以超越。

未来成本: 若想追求与海外同等的推理质量和稳定性,未来可能需要采用更高端的算力卡,导致成本优势可能收窄。

四、 关于“小龙虾”(AI助手产品)的讨论

增长驱动: “小龙虾”类AI助手的流行是近期带动国内模型Token消耗上涨的重要原因之一,用户将其作为调用国内模型的廉价接口。

渗透率与使用深度: 存在不同看法:

一方认为当前渗透率已较高,增长可能接近瓶颈。

另一方认为,即使在目标用户(知识工作者)中,安装率和深度使用率(集成到工作流)仍然很低,未来还有很大增长空间。

使用形态: 目前仍以个人电脑端为主,云电脑版本占比相对较少。它对终端设备要求低,跨平台支持好。

五、 其他关键问答

为何不将商用API直接部署在海外服务器?

可以部署(开源模型无限制),但不经济。海外基础设施成本高,且部署门槛高。国内模型出海的核心优势在于性价比,若用海外算力则丧失此优势。

是否租赁亚马逊、谷歌云算力?

仅有少量测试用途,不会大规模用于商业服务,主要出于成本考量。

第三方独立模型厂 vs. 互联网大厂:

独立厂商优势: 专注、灵活、市场响应速度快,更容易抓住突发性机会(如“小龙虾”热潮)。

大厂优势: 拥有规模优势(算力、人才),在行业进入平稳发展期后可能通过价格和技术碾压独立厂商。

光缆带宽限制问题:

当前推理任务对带宽要求不高,且可通过东南亚等多路径传输,暂未构成严重瓶颈。这与训练阶段需要传输海量数据不同。

核心结论

国产大模型通过 “海外前端引流+国内算力推理” 的混合架构,以显著的性价比优势成功切入海外市场,尤其在代码生成等场景。增长由海外AI应用需求驱动,但面临模型迭代存在时差、国产算力稳定性待提升、以及长期可能面临成本优势收窄等挑战。市场竞争中,独立厂商凭借灵活性抢占先机,而大厂则拥有深厚的规模资源。数据合规通过协议和脱敏处理,目前被认为是可控的。

OpenClaw爆火推动AI竞争进入Agent执行时代,腾讯生态成为其核心壁垒。不同于Chatbot赛道侧重模型性能,Agent时代核心看工具调用与全场景渗透能力,平台生态价值凸显。腾讯依托微信、企微、腾讯文档等核心产品协同,以及小程序千万级开发者生态,构建起难以复制的壁垒,同时加速AI布局,抢占新一轮竞争主动权。

腾讯“龙虾”产品矩阵,分层覆盖全场景。小白用户有WorkBuddy(零配置职场桌面场景)、QClaw(微信对话、远程操控等,覆盖5000+skills);开发者有腾讯云Lighthouse(极简部署、云端稳定在线);企业端升级ADP智能体开发平台与云桌面。其核心优势的是可无缝接入微信、QQ等超级流量入口,联动生产力工具,有望成为国民级全场景AI工具。

微信AI智能体预计26Q3全量上线,计划年中灰度测试(时间表或随研发调整)。微信作为国民级应用,生态完善,可精准捕捉用户需求并实现任务闭环,有望成为全能AI助手。腾讯已通过AI小程序成长计划布局,实现平台与开发者双赢,为微信AI Agent迭代提供数据支撑,加速从被动响应需求到主动提供建议、从单纯输出回答到全程代理操作的智能化升级。

Context和记忆能力或将成为混元新一代模型的核心迭代方向。腾讯混元2月发布研究指出,Context运用是模型突破瓶颈、落地高价值应用的关键;3月提出功能性记忆范式,提升模型任务适配与生成质量。我们预计2026年混元将重点迭代该能力,为AI Agent规模化落地等高价值应用提供技术支撑。

考虑近期腾讯AI进展加速且生态优势有望在新一轮竞争中得到凸显,当前估值具备性价比。维持“买入”评级。

中信证券互联网团队 廖原/徐航/丁晓月/王悦如/张苡铭

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!