返回话题列表
乐晴行业观察
2026/04/20 09:05
类型 talk 1阅读 1

AI算力链更新:大模型+推理算...

发布者:乐晴

①谷歌正与迈威尔科技洽谈合作开发新型人工智能推理芯片。

②DeepSeek启动成立以来首次大规模外部融资,拟募资规模约20亿元人民币,对应投前估值不低于100亿美元。

DeepSeek V4在数学逻辑推理、专业代码编程、通用知识理解、智能体应用等通用大模型核心领域均实现突破性进展,综合能力全面超越当前海外主流顶级大模型,性能表现断层领先。

且在训练架构上,DeepSeek V4开始明显转向适配国产算力,成为国产大模型拥抱国产算力的关键里程碑。

同期,DeepSeek启动成立以来首次大规模外部融资,拟募资规模约20亿元人民币,对应投前估值不低于100亿美元。本次募资将重点用于模型迭代、国产算力生态适配、商业化落地及团队建设,充分体现了资本市场对其技术实力的高度认可。

相关梳理:

DeepSeek直接相关:每日互动深度参与DeepSeek生态落地,完成模型私有化部署与场景适配。

DeepSeek算力服务相关:

并行科技:DeepSeek核心算力服务商,深度绑定模型研发,覆盖全架构算力支撑。

杭钢股份:完成DeepSeek模型适配部署,对外提供相关算力租赁服务。

华为昇腾算力相关:

华丰科技:华为昇腾超节点高速互联核心供应商,深度绑定国产算力生态。

航天电器:华为昇腾生态核心配套商,为国产算力设备提供高可靠连接器产品。

东吴计算机首席 王紫敬

月之暗面联合清华大学最新发表的论文《Prefill-as-a-Service: KVCache of Next-Generation Models Could Go Cross-Datacenter》提出PrFaaS推理架构方案,通过混合架构将KV Cache吞吐量大幅降低,从理论层面打破了此前Prefill与Decode两个推理阶段必须绑定在同一RDMA域的调度限制,为推理任务跨地域、跨异构集群灵活调度提供了可行路径参考。

国产模型端优化有望推动国产算力加速发展

提升国产异构算力利用效率:Prefill与Decode两类任务可以调度到更加适配的硬件集群运行。

降低国产算力部署门槛:PrFaaS架构下KV Cache传输不再依赖昂贵的RDMA网络设备,国产芯片集群部署成本降低。

支持跨域全局调度,同时混合架构降低了KV Cache对显存带宽的要求,顺应国产算力的超节点发展等产业趋势并显示性价比优势。

AI Agent时代Token需求的非线性增长,或直接带来超预期的AI算力需求,我们仍建议按“一芯二模三云”作为投资主线,重视以“一芯”寒武纪为代表的国产算力的重要价值。

风险提示:行业需求释放进度不及预期;行业竞争加剧。

国联民生计算机吕伟/郭新宇

Agent重塑算力底座,需求爆发推动CPU量价齐升

传统大模型的单次交互正向Agent复杂多步推理循环演进,随着智能体任务变多变杂,计算负载正从GPU密集转向CPU密集,预计AI数据中心CPU与GPU配比将从当前的1:8向未来1:2甚至1:1转变。同时,AI算力需求爆发叠加产能被GPU大量挤占,服务器CPU正呈现从消费级蔓延至企业级的递进式涨价,短期缺货难以缓解。当前,Nvidia、Arm及头部云厂商均在加速自研CPU布局,印证了CPU在AI算力基础设施中重要性的持续提升。

突破推理成本瓶颈,ASIC引爆硬件异构新时代

随着AI从训练走向推理,Token成本已成制约应用扩张的核心瓶颈。

定制化ASIC凭借极致的能效比正成为降低单Token成本的最优解,Marvell预计2023-2028年全球AI ASIC市场年复合增长率将高达53%。为规避通用GPU强绑定风险与实现降本,Meta联手博通延期合作至2029并开发2nm ASIC,OpenAI、谷歌亦加码外部合作。

目前超六成AI初创公司选择ASIC路线,通过主攻极端场景、深耕垂直行业或生态绑定巨头实现突围,算力部署正加速走向通用GPU为主+定制ASIC为辅的异构协同模式。

1)CPU赛道存在较大认知差,多数投资人仍以为只有Agent环节需要cpu调用(训练环节也是需要的,只是不是主力)其次对于产业格局的存在担忧,尤其觉得国内CSP仍有之前CPU存量剩余。在当前intel、AMD的2026年产能售罄,扩产需要时间,5-6月仍会涨价的产业背景下, 当前担忧格局略早。其次,伴随着模型能力增强和Agent(MAS、claw)渗透和使用率的指数级增加的背景下,GPU:CPU最终走向1:1的概率不断提升,属于当前芯片环节预期差最大的环节。

相关:Intel、amd、海光信息、中科曙光、禾盛新材。

2)国内模型的能力增强和TOKEN的指数级增长都会带动云进入持续提价阶段,对应算力服务、云服务等营收增速二阶导为正。周末流传的DS V4的benchmark图,正说明国内模型能力的持续增强。海外Mythos级模型的参数量跳跃增长,我们预期国内模型公司也会参考类似技术路径,提升基模能力。对应将会是算力需求更夸张的增长,#供给弱于需求将会持续存在,且国内会更显(目前字节日均token消耗已超越谷歌)。

相关:金山云、以协创、利通、盈峰、ykd为代表的算力服务公司。

3)应用层面迎来较好的交易期,港股新股的财务数据弹性优于A股,可以多关注调整较多的港股次新标的。

PS:产业政策层面当前可以多关注国七的进展,涉及新车型标定服务的公司有望率先受益。

1)CPU需求会有提升

黄仁勋解释CPU不再只是支持模型,而是开始驱动模型。

需求端升级推动CPU系统价值显著提升。CPU在数据中心中承担前端请求调度、状态管理、多轮任务规划和工具调用等复杂职责,成为整个计算系统的核心中枢。

2)供不应求已体现CPU涨价

Intel和AMD已通知客户,将全系列服务器CPU上调价格,交货周期显著延长。2月以来CPU普遍涨幅在10-15%。

AMD多次强调26年CPU已全面售罄,未来3-5年内数据中心业务年增长率或超60%,短期内需求没有任何放缓或停止的迹象。

供给端刚性加剧短期涨价压力。先进制程产能紧张、封装良率要求提升及材料和物流成本上涨,使高端CPU成本结构上行。

3)国产CPU迎来重要机会

供应链紧张为国产CPU提供了进入市场的窗口,国内企业对本土算力的需求增长,也为国产CPU构建稳定应用场景,逐步形成差异化竞争力和长期产业布局优势。

相关:海光信息、澜起科技、龙芯中科、禾盛新材、中国长城

Claude-Opus4.7 发布,编程、多模态、网安等多项能力显著增强,这一系列改进,#本质目标是【对复杂任务表现的加强】。Github、Windsurf、Harvey等企业客户试用后纷纷给予积极评价。

Opus 4.7价格虽与Opus 4.6 相同,但新的tokenizer导致相同的输入可能会映射到更多的tokens(大约是原先的1.0–1.35 倍),并且在更高的努力级别下,Opus 4.7 会进行更多的思考并输出更多token, 有望带来算力需求上行。

Opus 4.7的发布标志着AI大模型复杂长任务落地表现的持续改善,有利于Agent加速落地+提升算力需求,建议关注:

-拥有Coding及Agent能力的大模型厂商:智谱、Minimax、科大讯飞等。

-AI算力产业链,包括:

①AI芯片厂商(海光信息、寒武纪、沐曦股份、摩尔线程等)

②服务器厂商(中科曙光、浪潮信息、工业富联、紫光股份、神州数码、烽火通信等)

③算力租赁厂商:智微智能、协创数据、宏景科技等。

风险提示:技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。

孙行臻/陈泽青

一、Anthropic:

*发布ClaudeOpus4.7

*推出系列新功能:xhigh思考层级;任务预算功能;ClaudeCode增加/ultrareview命令、扩展自动模式

*推出新的CyberVerificationProgram

*ClaudeCode推出routines功能

*发布重新设计的ClaudeCode桌面应用

*发布ClaudeforWord

二、OpenAI:

*发布GPT‑Rosalind,专为生命科学研究打造

*Codex发布重大更新

*称将重点转向企业用户,计划推出“高价值专业工作”新模型

*发布AgentsSDK重大更新

*扩大TrustedAccessforCyber项目,推出GPT-5.4-Cyber

*强调Amazon合作,称与Microsoft在一定程度上限制了为企业客户提供服务的能力

*称Anthropic此前宣布的300亿年化收入存在约80亿美元“高估”

*称Anthropic在算力投入上存在战略失误:OpenAI计划到2030年拥有30吉瓦计算量,而Anthropic预计到2027年底大约为7到8吉瓦

三、Gemini:

*Google与五角大楼谈判,讨论将Gemini部署到机密环境

*GeminiMac桌面版上线,系首次将Gemini引入桌面端

*GeminiCLI推出Subagents功能

*发布文本转语音模型Gemini3.1FlashTTS

四、字节跳动:

*2026Q1,豆包海外版Dola单季下载量7200万次+(环比+47%),累计下载量2亿次+,3月平均DAU近1200万

*火山引擎与BytePlus(海外)同步上线Seedance2.0系列API服务

五、通义:

*宣布开源Qwen3.6-35B-A3B

*发布3D世界模型HappyOyster

*ATH事业群发布旗下首款AI开发工具Meoo

*为控制成本,QwenOAuth取消免费额度

六、智谱:

*由于算力资源紧张,GLMCodingPlan限时退款

七、MiniMax:

*正式上线全球首个云端沙箱Hermes——MaxHermes且MiniMax模型已是HermesAgent中使用量最高的模型之一

*MiniMaxM2.7正式开源,并宣布变更开源使用条款,商业用途需获书面授权

*MiniMaxAgent桌面端功能更新:PocketBeta、ComputerUse

*发布MiniMaxMusic2.6,与MMX-CLI深度优化

*发布MMX-CLI,专为AIAgent设计

北美云计算:增长前景逐渐清晰,Capex ROI担忧迎来缓解

Anthropic营收爆发+毛利率或低于乐观预期、带来云计算庞大需求。Anthropic的年化收入ARR已经从25年底的90亿美元提升至26年4月初的300亿,若保持月度环比增长趋势,26年底将冲击800-1000亿的区间,带来庞大算力需求。其次,25年11月市场预期的Anthropic的26年毛利率将为63%,但当前公司将Claude Enterprise从“高额固定付费席位为主”修改为“低月费+按实际用量付费”,侧面反映当前Tokens调用下对公司毛利率的压力,预计其实际推理算力成本明显高于此前乐观假设。

Anthropic与Coreweave达成多年云服务协议、反映其算力需求从CSP向Neocloud溢出。此前市场担心CSP庞大的AI Capex长周期运营下的ROI,但从目前谷歌云、AWS 26年即将交付的容量来看,仍难以满足Anthropic的算力需求,使得其在26年4月首次开始与CSP之外的新云达成云服务采买合作。也即谷歌云和亚马逊AWS短期内仍有刚性算力供需缺口。

AI云计算供需关系紧张程度加剧为短期边际变化,但中长期CSP的AI PaaS生态构建、提供AI推理阶段云弹性+更高云服务质量将对其AI云商业模式和盈利稳定性改善具有更重要的意义。持续关注CSP提供的算力溢价程度+大模型API调用中来自CSP平台渠道的占比。

1)重点关注谷歌云(此前市场已有增长加速共识)和亚马逊AWS(预期低、Project Rainier自25Q4后大规模向Anthropic交付)。目前彭博一致预期亚马逊AWS 26Q1营收增速为25-26%,亚马逊26年4月年度股东信指出AWS AI云ARR达到150亿;我们预计AWS有望在后续持续上修26年营收增速预期。

2)Coreweave等Neocloud短期将迎来算力供需关系紧张下的盈利弹性,但缺乏丰富而高质量的云生态下中长期利润率担忧仍在。

事件:4月16日,腾讯发布并开源混元3D世界模型2.0,阿里巴巴ATH事业部推出世界模型Happy Oyster。4月17日,“杭州六小龙”之一群核科技在港交所上市。

1)腾讯混元3D世界模型2.0:支持3D资产导出与编辑。支持用户多模态输入,一键生成可漫游世界。新一代模型画面精细度和真实感大幅提升,新增角色模式加强交互性,支持基于图片、视频构建3D数字孪生场景。模型主要亮点在于其能够生成3D资产文件,并能导入到Unity、UE 等游戏引擎进行二次编辑。

2)阿里Happy Oyster:实时构建与交互性能优异。基于原生多模态架构,模型支持多模态输入与音视频联合生成,目前支持漫游(Wander)和导演(Direct)两种模式,主打实时构建和交互性能。模型采用流式生成框架、引入持续状态复用机制,在实时响应、交互性、长时间演化一致性保持等方面表现领先。其中,导演模式下用户可通过文字实时操控剧情走向,支持3分钟/720P视频生成;漫游模式支持1分钟/480P视频生成。

3)群核科技:空间智能第一股,布局具身智能训练。2025年公司实现营收8.2亿元,同比增长8.6%;毛利率提升至82.2%;经调整净利润为5710万元,实现扭亏。公司基于空间场景数据优势,从空间设计软件提供商向空间智能服务提供商转型。空间智能业务方面,公司已发布SpatialVerse空间智能平台,2025年已服务于16家客户,实现营收520万元;2025年,公司推出空间语言模型SpatialLM、空间生成模型SpatialGen。公司已与智元机器人等企业达成合作,将业务拓展至具身智能训练、电商、XR等领域。

资料来源:腾讯混元微信公众号、Happy Oyster官网、群核科技招股书,据公开资料整理,不涉及研究观点和投资建议。

事件:杭州六小龙之一、物理AI龙头群核科技于4月17日登陆港交所,上市首日收涨逾144%。

1)行业空间:中国空间设计软件市场2024年规模约33亿元,预计2029年增至66亿元,5年CAGR约14.9%;全球市场2024年约190亿元,预计2029年增至336亿元,5年CAGR约12%。群核按2024年收入计市占率23.2%,位居中国第一。同时,公司所处赛道正向更广泛的通用设计与可视化市场延伸,2024年中国空间设计软件仅占整体市场的4.4%,行业天花板仍远未触及。

2)公司概况:公司定位云原生空间设计软件厂商,核心产品为酷家乐、Coohom,并向SpatialVerse、空间智能等方向延伸;底层能力主要包括GPU基础设施和AI模型。商业模式以订阅为主,企业客户是收入核心。2023/2024/2025年收入分别为6.6/7.5/8.2亿元,毛利率分别为76.8%/80.9%/82.2%。

3)公司优势:①产品侧,云原生+AI+实时渲染,设计结果可进一步转化为可生产图纸;②链路侧,软件可对接CRM、ERP、CAM、MES、CNC等系统,从设计环节向生产、采购、施工等流程延伸;③底座侧,自建GPU集群支撑高频渲染和AI训练/推理,形成性能和成本优势。

4)经营质量:公司2025年经调整净利润转正至0.57亿元,已基本跨越盈亏平衡点,经营杠杆开始释放。公司增长核心在B端客户,尤其是大客户。2025年B端客户订阅收入6.69亿元,占总订阅收入84.2%;大客户424家,大客户订阅收入3.63亿元,净收入留存率109%,头部客户续费和扩单能力较强。C端更多承担流量入口和转化功能,2025年非付费个人用户转付费转化率提升至9.6%。

5)估值与股权:上市后黄晓煌/陈航/朱皓分别持股14.0%/10.0%/3.82%,创始团队合计约27.8%,同时叠加高瓴、GGV、IDG、顺为、Coatue等机构股东,属于典型VC支持型股权结构。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!