AI链算力+应用更新 ①De...

发布者：乐晴

①DeepSeek官方宣布，DeepSeek-V4-Pro API永久降价。

②国家数据局将把推动词元（Token）经济发展纳入工作体系。

③美股AI应用软件股持续大涨，Zoom通讯涨超9%，Spotify涨超6%，The Trade Desk、Figma Inc、Workday涨超5%，Braze涨超4%。

④超聚变数字技术股份有限公司的创业板IPO正式获得受理。

DeepSeek官方宣布，DeepSeek-V4-Pro模型API价格将于2026年5月31日结束2.5折优惠活动后，正式调整为原定价的1/4。这一API2.5折优惠活动，原定6月起恢复原价，但最新公告确认，DeepSeek-V4-ProAPI将永久降为原价的1/4（相当于2.5折），即：每百万tokens输入（缓存命中）0.025元，输入（缓存未命中）3元，输出6元。

这一价格尤其在缓存命中场景下有极强价格竞争力，国内目前定价较低的模型中，尤其以缓存命中后的定价优势突出。以美元计，输入缓存命中、输入未命中、输出价格，DeepSeekv4pro、MinimaxM2.7、Hy3分别是0.004/0.435/0.87、0.06/0.3/1.2、0.105/0.123/0.43

预计对价格敏感型场景的冲击将保持延续，其他维度影响仍需要观察DeepSeek后续的版本迭代速度。

此外，对于其他模型公司目前的MaaS业务而言，面向企业端的商业模式早已不是按照token定价，例如阿里的Tokenplan和Qoder产品，同时企业还需要考量稳定性等因素。

在调整后，输入成本最低仅0.025元/百万Tokens，输出为6元/百万Tokens。明显低于同级别的国产模型，相比国外那些动不动几十上百块的大模型，这个确实算得上是白菜价。

DeepSeek的降价底气，主要是这三个：

1）自己的模型架构做得比较省，有成本优势。

2）“国产模型+国产芯片”这条路已经跑通（尤其跟华为昇腾的适配），DeepSeek不缺算力了。

3）降价与DeepSeek首轮融资传闻同步发酵，据说募资500亿-700亿元。马上拿到这么多的资金，自然有底气打价格战。

这意味着，国内AI大模型行业迎来“平价革命”；后续其他大模型厂商要么跟进，要么被DeepSeek抢份额。

对行业而言，这事最大的意义是用大模型的门槛又低了一截；以前很多小公司和开发者不敢随便调API，怕烧钱；现在便宜了，用的自然就多了。

主要利好两个方向：

一是AI应用，调用成本下来了，会加速AI对各行各业的渗透，比如AI游戏，AI医疗、AI企业服务等等；

二是国产算力，DeepSeek跟国产算力绑得比较紧，DeepSeek直接砸出“地板价”，会吸引更多的人使用，直接拉动整个国内AI算力产业链！

总之，相比其它AI巨头疯狂资本开支，搞军备竞赛。DeepSeek一直把模型成本压得更低，DeepSeek+华为的国产大模型+国产算力的闭环！有望重塑AI新的生态，新的玩法！以后我们用AI，就像水电、网络一样方便，人人都用得起。

1.参考了大摩的总BOM数字进行部分环节最新价格更新

2.补充了柜外部分（光）和用电部分的综合影响

3.内存区分了DRAM系列（HBM/DDR5/SRAM)和NAND，这样好去理解NV LPU和谷歌TPU对未来的影响

4.PCB部分仍然难以使用单价*用量方式计算，因此打包进了其他部分

更新结论：最高斜率k还是存/光，此外NV牺牲让利的毛利率多一些。

依然建议最终穿透到Token角度，否则无法准确认知交易“光，缺电，算力租赁，谷歌链”等多个热门板块，只看Rubin柜内容易偏差。

海外GPU租赁与国内AI云服务价格同步上行，算力价格中枢继续抬升。

1）Nebius发布GPU定价调整通知，自6月1日起上调H100、H200、B200、B300全系列GPU按需租赁价格，其中H100由2.95美元/小时上调至3.85美元/小时，涨幅约31%；B200由5.50美元/小时上调至7.15美元/小时，涨幅约30%。这意味着海外高端GPU租赁价格并未随供给扩张而回落，反而在AI需求高景气下继续上行。

2）国内同样出现AI云服务涨价趋势。腾讯云、阿里云、百度云等主要云厂商在2026年上半年已集体上调AI相关服务价格，涨幅从5%至400%不等，反映出模型训练、推理调用、AI coding、MaaS等需求持续放量，算力资源供需仍处于偏紧状态。

算力租赁不是“短期倒卡生意”，而是稀缺算力资源的价格重估。

1）GPU租赁价格上涨，本质上说明高端算力仍然供不应求。对于已经持有海外高端GPU、具备稳定客户渠道和运维能力的算力租赁厂商而言，收入端价格弹性正在增强，而设备折旧和融资成本相对固定，租赁单价上行将直接推动利润率改善。

2）更重要的是，H200确认无法通过合规渠道购买，短期并非利空算力租赁，反而强化了存量高端海外芯片的稀缺性。在新增合规供给受限的情况下，下游客户若仍需要H100、H200等海外高端算力，后续大概率只能通过具备拿卡能力、存量卡资源和海外算力调度能力的租赁厂商获取。

3）因此，算力租赁厂商的逻辑正在从“有没有卡”升级为“卡的价格能不能涨、利用率能不能维持、利润率能不能上修”。当前海外GPU租赁涨价、国内AI云服务涨价、H200供给受限三重因素叠加，均指向算力租赁资产的盈利能力重估。

算力租赁/AIDC：协创数据、宏景科技、润泽科技、润建股份、大位科技、东方国信、利通电子、中贝通信、光环新网等

风险提示：AI发展不及预期、互联网大厂资本开支不及预期

芯和光的故事还将继续，端的故事有望展开

本周CPU继续得到行业大佬加持，包括英特尔陈立武表示CPU与GPU配比可能从过去的1:8演变至1:1甚至4:1，英伟达黄仁勋表示自研Arm架构CPU本财年收入有望达到200亿美金、市场空间达2000亿美金。

CPO产业同样有明确进展，我们了解到27年CPO交换机的需求和出货量相比之前预期的20万台有进一步上修空间。不仅是CPO交换机，硅光技术在未来有广阔发展空间，例如最近产业界开始讨论的GPU-HBM光连接方案、硅基光波导OCS、MicroLED光互连等，本质上都是硅光技术的延申，都对光路耦合与准直提出更高要求。

此前我们关注端侧方向逻辑也开始演绎，谷歌Gemini 3.5 Flash以4倍于其他顶尖模型的输出速度提供了超出3.1 Pro的能力，有望推动端侧AI的渗透普及。随着基模能力的提升、海外网络设施不完善对端侧计算的需求，以及多模态AI技术有望突破，预计下半年端侧AI将有表现机会。

1）CPO、OCS：微光学无源器件核心供应商炬光科技。不论是明年即将0-1落地的CPO，还是OCS、MicroLED光互连等新技术，对公司而言都是巨大发展机会。硅基光波导方案的OCS目前主要技术挑战在于32、64乃至更多光纤通道的耦合；MicroLED光互连因单通道速率较低，更需要对成百上千通道进行耦合。公司的微透镜阵列、V型槽是绕不开的重要无源器件，且通道数越高，公司技术优势越显著。

2）CPU：我们认为CPU赛道还在大级别周期之初。海外CPU龙头（英特尔、AMD、ARM、高通），建议关注国产CPU阵营（海光、长城、禾盛新材）。

3）国产算力和应用：国产芯片龙头寒武纪（计算机组覆盖）、海光信息，晟腾链（电子组覆盖），以及超节点，如海光、浪潮、紫光股份、锐捷网络等。具备自主编辑器内核壁垒和充沛在手算力的卓易信息，目前公司AI编程进展顺利，商业化订单ARR已近4亿。

4）端侧AI：苹果AI眼镜有望在今年发布，Meta亦有边际变化。有消电、AI眼镜以及机器人结构件敞口的科森科技等。

以下为公开资料整理，仅供参考，不构成投资建议！

1）官宣总经销模式，总经销商直接赋能银牌及其他下游伙伴

根据大会内容，华为PAE聚焦钻石和金牌伙伴提供技术支持，同时培养2家总经销商，由总经销商面向银牌及以下伙伴提供支撑，华为负责对总经销商进行专项技术赋能。

2）华强+神码为总经销商，直接赋能昇腾下游

根据大会内容，华强&神码为华为计算部件总经销商，核心是降低客户技术门槛、运营成本和市场风险。

3）覆盖芯片、板卡、整机，支撑客户全阶段需求

根据大会，华强+神码将提供全栈技术支持与开放实验室服务，实现FPGA+昇腾异构算力方案突破，共享硬件开发经验与方案库，覆盖从芯片到板卡到整机的选型、系统方案设计，支撑客户从设计到量产全阶段需求。

天风计算机缪欣君/王祺深

以下为公开资料整理，仅供参考，不构成投资建议！

5月22日，寒武纪发布公告称，公司及全资、控股子公司拟向银行申请不超过120亿元综合授信额度，用于流动资金贷款、银行承兑汇票、保函等业务，授信期限36个月，可循环使用。

一、供给优化是本次大额授信的核心意义

我们认为市场对国产AI芯片最大的担忧在于先进工艺与封装等资源紧张，大规模交付能力不足；此次120亿元授信意味着公司正在提前储备未来数年大规模扩产、备货与交付能力，提前锁定关键环节供给，反映了寒武纪正加速进入规模化供给阶段。

二一季报已强力印证算力需求爆炸+供给改善

寒武纪2026年一季报预付及合同负债双高增：1）预付款项，由年初 7.45 亿元激增至18.97 亿元，环比大幅提升，公司主动锁定上游芯片、供应链资源，供给端瓶颈持续缓解，保障后续产能与交付；2）合同负债，由年初 610.62 万元飙升至3.96 亿元，订单与预收款项暴增，下游 AI 算力需求呈爆炸式增长，高景气度前置确认。

三国产模型持续突破，寒武纪加速适配。

DeepSeek-V4、GLM-5等国产模型在Agent、Coding、长上下文等能力上持续突破。DeepSeek-V4发布当日，寒武纪已基于vLLM推理框架完成对DeepSeek-V4 Flash&Pro双版本的Day 0 适配；此前，寒武纪已对DeepSeek系列模型开展深入的软硬件协同性能优化，达成业界领先的算力利用率水平。

四、全球算力短缺，国产算力重要性进一步提升。近期Blackwell、H100等GPU租赁价格持续上涨，交付周期拉长，全球算力供需缺口仍未缓解。在外部供给受限背景下，国产算力的重要性进一步提升。

五、其他国产算力：海光信息、利扬芯片、禾盛新材、壁韧科技、天数智芯、中芯国际、华虹半导体、摩尔线程、沐曦股份。

事件：智谱面向部分企业客户提供GLM-5.1高速版API“GLM-5.1-highspeed”。模型输出速度达到400 tokens/s，刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景，现已面向智谱MaaS平台部分企业客户开放服务。

——在过去，“快”往往意味着“小”，高速模型几乎总是轻量级模型。GLM-5.1高速版打破了这一行业惯例，首次在国产大模型中，将旗舰级能力与极致低延迟同时带入生产环境，无需再为响应速度牺牲模型质量。

——GLM-5.1高速版API“GLM-5.1-highspeed”由智谱GLM团队与TileRT团队联合打造，在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化。

观点重申：

1）DeepSeek V4 Pro 的综合能力领先，并未撼动 GLM-5.1 在 Coding Agent 场景下的位置。Coding Agent 与单一模型的综合智商指标并非同一维度的竞争。前者考察的是长程多轮任务中的稳定性、工具调用的可靠性、错误回收的鲁棒性，依赖的是工程沉淀和数据飞轮，而不仅是底层模型能力的天花板。智谱自 GLM-4.5 起即将 Coding 锁定为核心方向，连续多代版本在该方向上专门优化，形成了较厚的工程护城河。Artificial Analysis 此次测评结果验证了这一判断。

2）智谱 GLM 自 5 系列发布以来已多次上调 API 价格，期间调用量不降反升，表明价格弹性较低；Anthropic 虽未调整面值价格，但通过收紧每周使用额度、调整 tokenizer 计数口径等方式，隐性抬升单位token定价。整个行业实际处于一轮隐性提价周期，DeepSeek 的阶段性折扣更接近单点事件，不代表模型环节系统性降价。Token 整体仍处于供不应求状态。

3）国内模型公司的 ARR 仍处于早期阶段。参照 Anthropic 的 ARR 增长曲线（23年底/24年底/25年底的ARR分别为 1/10/90 亿美元，26年5月初ARR超440亿美元），国内头部模型公司目前仍处于该曲线的起步段。非对称优势在于：海外头部模型短期内难以直接进入中国大陆市场，而国内模型则凭借性价比优势快速渗透海外市场。这意味着国内模型的市场空间，同时来自a)国内付费订阅渗透率提升+b)海外平价替代。

我们看好智谱作为中国大模型代表性公司参与全球竞争的潜力，并认为其 Coding、Agent 与长周期任务能力将随模型迭代持续提升。后续关注：算力合作进展、模型进展、纳入恒科指数及港股通等。

风险提示：模型竞争加剧；算力供应不足；地缘政治风险。

张良卫/周良玖/张文雨

*公开资料整理，仅作为行业分析参考，不构成任何投资建议！