AI链算力+应用更新 ①De...
发布者:乐晴
①DeepSeek官方宣布,DeepSeek-V4-Pro API永久降价。
②国家数据局将把推动词元(Token)经济发展纳入工作体系。
③美股AI应用软件股持续大涨,Zoom通讯涨超9%,Spotify涨超6%,The Trade Desk、Figma Inc、Workday涨超5%,Braze涨超4%。
④超聚变数字技术股份有限公司的创业板IPO正式获得受理。
DeepSeek官方宣布,DeepSeek-V4-Pro模型API价格将于2026年5月31日结束2.5折优惠活动后,正式调整为原定价的1/4。这一API2.5折优惠活动,原定6月起恢复原价,但最新公告确认,DeepSeek-V4-ProAPI将永久降为原价的1/4(相当于2.5折),即:每百万tokens输入(缓存命中)0.025元,输入(缓存未命中)3元,输出6元。
这一价格尤其在缓存命中场景下有极强价格竞争力,国内目前定价较低的模型中,尤其以缓存命中后的定价优势突出。以美元计,输入缓存命中、输入未命中、输出价格,DeepSeekv4pro、MinimaxM2.7、Hy3分别是0.004/0.435/0.87、0.06/0.3/1.2、0.105/0.123/0.43
预计对价格敏感型场景的冲击将保持延续,其他维度影响仍需要观察DeepSeek后续的版本迭代速度。
此外,对于其他模型公司目前的MaaS业务而言,面向企业端的商业模式早已不是按照token定价,例如阿里的Tokenplan和Qoder产品,同时企业还需要考量稳定性等因素。
在调整后,输入成本最低仅0.025元/百万Tokens,输出为6元/百万Tokens。明显低于同级别的国产模型,相比国外那些动不动几十上百块的大模型,这个确实算得上是白菜价。
DeepSeek的降价底气,主要是这三个:
1)自己的模型架构做得比较省,有成本优势。
2)“国产模型+国产芯片”这条路已经跑通(尤其跟华为昇腾的适配),DeepSeek不缺算力了。
3)降价与DeepSeek首轮融资传闻同步发酵,据说募资500亿-700亿元。马上拿到这么多的资金,自然有底气打价格战。
这意味着,国内AI大模型行业迎来“平价革命”;后续其他大模型厂商要么跟进,要么被DeepSeek抢份额。
对行业而言,这事最大的意义是用大模型的门槛又低了一截;以前很多小公司和开发者不敢随便调API,怕烧钱;现在便宜了,用的自然就多了。
主要利好两个方向:
一是AI应用,调用成本下来了,会加速AI对各行各业的渗透,比如AI游戏,AI医疗、AI企业服务等等;
二是国产算力,DeepSeek跟国产算力绑得比较紧,DeepSeek直接砸出“地板价”,会吸引更多的人使用,直接拉动整个国内AI算力产业链!
总之,相比其它AI巨头疯狂资本开支,搞军备竞赛。DeepSeek一直把模型成本压得更低,DeepSeek+华为的国产大模型+国产算力的闭环!有望重塑AI新的生态,新的玩法!以后我们用AI,就像水电、网络一样方便,人人都用得起。
1.参考了大摩的总BOM数字进行部分环节最新价格更新
2.补充了柜外部分(光)和用电部分的综合影响
3.内存区分了DRAM系列(HBM/DDR5/SRAM)和NAND,这样好去理解NV LPU和谷歌TPU对未来的影响
4.PCB部分仍然难以使用单价*用量方式计算,因此打包进了其他部分
更新结论:最高斜率k还是存/光,此外NV牺牲让利的毛利率多一些。
依然建议最终穿透到Token角度,否则无法准确认知交易“光,缺电,算力租赁,谷歌链”等多个热门板块,只看Rubin柜内容易偏差。
海外GPU租赁与国内AI云服务价格同步上行,算力价格中枢继续抬升。
1)Nebius发布GPU定价调整通知,自6月1日起上调H100、H200、B200、B300全系列GPU按需租赁价格,其中H100由2.95美元/小时上调至3.85美元/小时,涨幅约31%;B200由5.50美元/小时上调至7.15美元/小时,涨幅约30%。这意味着海外高端GPU租赁价格并未随供给扩张而回落,反而在AI需求高景气下继续上行。
2)国内同样出现AI云服务涨价趋势。腾讯云、阿里云、百度云等主要云厂商在2026年上半年已集体上调AI相关服务价格,涨幅从5%至400%不等,反映出模型训练、推理调用、AI coding、MaaS等需求持续放量,算力资源供需仍处于偏紧状态。
算力租赁不是“短期倒卡生意”,而是稀缺算力资源的价格重估。
1)GPU租赁价格上涨,本质上说明高端算力仍然供不应求。对于已经持有海外高端GPU、具备稳定客户渠道和运维能力的算力租赁厂商而言,收入端价格弹性正在增强,而设备折旧和融资成本相对固定,租赁单价上行将直接推动利润率改善。
2)更重要的是,H200确认无法通过合规渠道购买,短期并非利空算力租赁,反而强化了存量高端海外芯片的稀缺性。在新增合规供给受限的情况下,下游客户若仍需要H100、H200等海外高端算力,后续大概率只能通过具备拿卡能力、存量卡资源和海外算力调度能力的租赁厂商获取。
3)因此,算力租赁厂商的逻辑正在从“有没有卡”升级为“卡的价格能不能涨、利用率能不能维持、利润率能不能上修”。当前海外GPU租赁涨价、国内AI云服务涨价、H200供给受限三重因素叠加,均指向算力租赁资产的盈利能力重估。
算力租赁/AIDC:协创数据、宏景科技、润泽科技、润建股份、大位科技、东方国信、利通电子、中贝通信、光环新网等
风险提示:AI发展不及预期、互联网大厂资本开支不及预期
芯和光的故事还将继续,端的故事有望展开
本周CPU继续得到行业大佬加持,包括英特尔陈立武表示CPU与GPU配比可能从过去的1:8演变至1:1甚至4:1,英伟达黄仁勋表示自研Arm架构CPU本财年收入有望达到200亿美金、市场空间达2000亿美金。
CPO产业同样有明确进展,我们了解到27年CPO交换机的需求和出货量相比之前预期的20万台有进一步上修空间。不仅是CPO交换机,硅光技术在未来有广阔发展空间,例如最近产业界开始讨论的GPU-HBM光连接方案、硅基光波导OCS、MicroLED光互连等,本质上都是硅光技术的延申,都对光路耦合与准直提出更高要求。
此前我们关注端侧方向逻辑也开始演绎,谷歌Gemini 3.5 Flash以4倍于其他顶尖模型的输出速度提供了超出3.1 Pro的能力,有望推动端侧AI的渗透普及。随着基模能力的提升、海外网络设施不完善对端侧计算的需求,以及多模态AI技术有望突破,预计下半年端侧AI将有表现机会。
1)CPO、OCS:微光学无源器件核心供应商炬光科技。不论是明年即将0-1落地的CPO,还是OCS、MicroLED光互连等新技术,对公司而言都是巨大发展机会。硅基光波导方案的OCS目前主要技术挑战在于32、64乃至更多光纤通道的耦合;MicroLED光互连因单通道速率较低,更需要对成百上千通道进行耦合。公司的微透镜阵列、V型槽是绕不开的重要无源器件,且通道数越高,公司技术优势越显著。
2)CPU:我们认为CPU赛道还在大级别周期之初。海外CPU龙头(英特尔、AMD、ARM、高通),建议关注国产CPU阵营(海光、长城、禾盛新材)。
3)国产算力和应用:国产芯片龙头寒武纪(计算机组覆盖)、海光信息,晟腾链(电子组覆盖),以及超节点,如海光、浪潮、紫光股份、锐捷网络等。具备自主编辑器内核壁垒和充沛在手算力的卓易信息,目前公司AI编程进展顺利,商业化订单ARR已近4亿。
4)端侧AI:苹果AI眼镜有望在今年发布,Meta亦有边际变化。有消电、AI眼镜以及机器人结构件敞口的科森科技等。
以下为公开资料整理,仅供参考,不构成投资建议!
1)官宣总经销模式,总经销商直接赋能银牌及其他下游伙伴
根据大会内容,华为PAE聚焦钻石和金牌伙伴提供技术支持,同时培养2家总经销商,由总经销商面向银牌及以下伙伴提供支撑,华为负责对总经销商进行专项技术赋能。
2)华强+神码为总经销商,直接赋能昇腾下游
根据大会内容,华强&神码 为华为计算部件总经销商,核心是降低客户技术门槛、运营成本和市场风险。
3)覆盖芯片、板卡、整机,支撑客户全阶段需求
根据大会,华强+神码将提供全栈技术支持与开放实验室服务,实现FPGA+昇腾异构算力方案突破,共享硬件开发经验与方案库,覆盖从芯片到板卡到整机的选型、系统方案设计,支撑客户从设计到量产全阶段需求。
天风计算机 缪欣君/王祺深
以下为公开资料整理,仅供参考,不构成投资建议!
5月22日,寒武纪发布公告称,公司及全资、控股子公司拟向银行申请不超过120亿元综合授信额度,用于流动资金贷款、银行承兑汇票、保函等业务,授信期限36个月,可循环使用。
一、供给优化是本次大额授信的核心意义
我们认为市场对国产AI芯片最大的担忧在于先进工艺与封装等资源紧张,大规模交付能力不足;此次120亿元授信意味着公司正在提前储备未来数年大规模扩产、备货与交付能力,提前锁定关键环节供给,反映了寒武纪正加速进入规模化供给阶段。
二 一季报已强力印证算力需求爆炸+供给改 善
寒武纪2026年一季报预付及合同负债双高增:1)预付款项,由年初 7.45 亿元激增至18.97 亿元,环比大幅提升,公司主动锁定上游芯片、供应链资源,供给端瓶颈持续缓解,保障后续产能与交付;2)合同负债,由年初 610.62 万元飙升至3.96 亿元,订单与预收款项暴增,下游 AI 算力需求呈爆炸式增长,高景气度前置确认。
三 国产模型持续突破,寒武纪加速适配。
DeepSeek-V4、GLM-5等国产模型在Agent、Coding、长上下文等能力上持续突破。DeepSeek-V4发布当日,寒武纪已基于vLLM推理框架完成对DeepSeek-V4 Flash&Pro双版本的Day 0 适配;此前,寒武纪已对DeepSeek系列模型开展深入的软硬件协同性能优化,达成业界领先的算力利用率水平。
四、全球算力短缺,国产算力重要性进一步提 升。近期Blackwell、H100等GPU租赁价格持续上涨,交付周期拉长,全球算力供需缺口仍未缓解。在外部供给受限背景下,国产算力的重要性进一步提升。
五、其他国产算力:海光信息、利扬芯片、禾 盛新材、壁韧科技、天数智芯、中芯国际、华虹半导体、摩尔线程、沐曦股份。
事件:智谱面向部分企业客户提供GLM-5.1高速版API“GLM-5.1-highspeed”。模型输出速度达到400 tokens/s,刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景,现已面向智谱MaaS平台部分企业客户开放服务。
——在过去,“快”往往意味着“小”,高速模型几乎总是轻量级模型。GLM-5.1高速版打破了这一行业惯例,首次在国产大模型中,将旗舰级能力与极致低延迟同时带入生产环境,无需再为响应速度牺牲模型质量。
——GLM-5.1高速版API“GLM-5.1-highspeed”由智谱GLM团队与TileRT团队联合打造,在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化。
观点重申:
1)DeepSeek V4 Pro 的综合能力领先,并未撼动 GLM-5.1 在 Coding Agent 场景下的位置。Coding Agent 与单一模型的综合智商指标并非同一维度的竞争。前者考察的是长程多轮任务中的稳定性、工具调用的可靠性、错误回收的鲁棒性,依赖的是工程沉淀和数据飞轮,而不仅是底层模型能力的天花板。智谱自 GLM-4.5 起即将 Coding 锁定为核心方向,连续多代版本在该方向上专门优化,形成了较厚的工程护城河。Artificial Analysis 此次测评结果验证了这一判断。
2)智谱 GLM 自 5 系列发布以来已多次上调 API 价格,期间调用量不降反升,表明价格弹性较低;Anthropic 虽未调整面值价格,但通过收紧每周使用额度、调整 tokenizer 计数口径等方式,隐性抬升单位token定价。整个行业实际处于一轮隐性提价周期,DeepSeek 的阶段性折扣更接近单点事件,不代表模型环节系统性降价。Token 整体仍处于供不应求状态。
3)国内模型公司的 ARR 仍处于早期阶段。 参照 Anthropic 的 ARR 增长曲线(23年底/24年底/25年底的ARR分别为 1/10/90 亿美元,26年5月初ARR超440亿美元),国内头部模型公司目前仍处于该曲线的起步段。非对称优势在于:海外头部模型短期内难以直接进入中国大陆市场,而国内模型则凭借性价比优势快速渗透海外市场。这意味着国内模型的市场空间,同时来自a)国内付费订阅渗透率提升+b)海外平价替代。
我们看好智谱作为中国大模型代表性公司参与全球竞争的潜力,并认为其 Coding、Agent 与长周期任务能力将随模型迭代持续提升。后续关注:算力合作进展、模型进展、纳入恒科指数及港股通等。
风险提示:模型竞争加剧;算力供应不足;地缘政治风险。
张良卫/周良玖/张文雨
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!