AI算力链更新：大模型+推理算...

发布者：乐晴

①谷歌正与迈威尔科技洽谈合作开发新型人工智能推理芯片。

②DeepSeek启动成立以来首次大规模外部融资，拟募资规模约20亿元人民币，对应投前估值不低于100亿美元。

DeepSeek V4在数学逻辑推理、专业代码编程、通用知识理解、智能体应用等通用大模型核心领域均实现突破性进展，综合能力全面超越当前海外主流顶级大模型，性能表现断层领先。

且在训练架构上，DeepSeek V4开始明显转向适配国产算力，成为国产大模型拥抱国产算力的关键里程碑。

同期，DeepSeek启动成立以来首次大规模外部融资，拟募资规模约20亿元人民币，对应投前估值不低于100亿美元。本次募资将重点用于模型迭代、国产算力生态适配、商业化落地及团队建设，充分体现了资本市场对其技术实力的高度认可。

相关梳理：

DeepSeek直接相关：每日互动深度参与DeepSeek生态落地，完成模型私有化部署与场景适配。

DeepSeek算力服务相关：

并行科技：DeepSeek核心算力服务商，深度绑定模型研发，覆盖全架构算力支撑。

杭钢股份：完成DeepSeek模型适配部署，对外提供相关算力租赁服务。

华为昇腾算力相关：

华丰科技：华为昇腾超节点高速互联核心供应商，深度绑定国产算力生态。

航天电器：华为昇腾生态核心配套商，为国产算力设备提供高可靠连接器产品。

东吴计算机首席王紫敬

月之暗面联合清华大学最新发表的论文《Prefill-as-a-Service: KVCache of Next-Generation Models Could Go Cross-Datacenter》提出PrFaaS推理架构方案，通过混合架构将KV Cache吞吐量大幅降低，从理论层面打破了此前Prefill与Decode两个推理阶段必须绑定在同一RDMA域的调度限制，为推理任务跨地域、跨异构集群灵活调度提供了可行路径参考。

国产模型端优化有望推动国产算力加速发展

提升国产异构算力利用效率：Prefill与Decode两类任务可以调度到更加适配的硬件集群运行。

降低国产算力部署门槛：PrFaaS架构下KV Cache传输不再依赖昂贵的RDMA网络设备，国产芯片集群部署成本降低。

支持跨域全局调度，同时混合架构降低了KV Cache对显存带宽的要求，顺应国产算力的超节点发展等产业趋势并显示性价比优势。

AI Agent时代Token需求的非线性增长，或直接带来超预期的AI算力需求，我们仍建议按“一芯二模三云”作为投资主线，重视以“一芯”寒武纪为代表的国产算力的重要价值。

风险提示：行业需求释放进度不及预期；行业竞争加剧。

国联民生计算机吕伟/郭新宇

Agent重塑算力底座，需求爆发推动CPU量价齐升

传统大模型的单次交互正向Agent复杂多步推理循环演进，随着智能体任务变多变杂，计算负载正从GPU密集转向CPU密集，预计AI数据中心CPU与GPU配比将从当前的1:8向未来1:2甚至1:1转变。同时，AI算力需求爆发叠加产能被GPU大量挤占，服务器CPU正呈现从消费级蔓延至企业级的递进式涨价，短期缺货难以缓解。当前，Nvidia、Arm及头部云厂商均在加速自研CPU布局，印证了CPU在AI算力基础设施中重要性的持续提升。

突破推理成本瓶颈，ASIC引爆硬件异构新时代

随着AI从训练走向推理，Token成本已成制约应用扩张的核心瓶颈。

定制化ASIC凭借极致的能效比正成为降低单Token成本的最优解，Marvell预计2023-2028年全球AI ASIC市场年复合增长率将高达53%。为规避通用GPU强绑定风险与实现降本，Meta联手博通延期合作至2029并开发2nm ASIC，OpenAI、谷歌亦加码外部合作。

目前超六成AI初创公司选择ASIC路线，通过主攻极端场景、深耕垂直行业或生态绑定巨头实现突围，算力部署正加速走向通用GPU为主+定制ASIC为辅的异构协同模式。

1）CPU赛道存在较大认知差，多数投资人仍以为只有Agent环节需要cpu调用(训练环节也是需要的，只是不是主力）其次对于产业格局的存在担忧，尤其觉得国内CSP仍有之前CPU存量剩余。在当前intel、AMD的2026年产能售罄，扩产需要时间，5-6月仍会涨价的产业背景下，当前担忧格局略早。其次，伴随着模型能力增强和Agent(MAS、claw)渗透和使用率的指数级增加的背景下，GPU:CPU最终走向1：1的概率不断提升，属于当前芯片环节预期差最大的环节。

相关：Intel、amd、海光信息、中科曙光、禾盛新材。

2)国内模型的能力增强和TOKEN的指数级增长都会带动云进入持续提价阶段，对应算力服务、云服务等营收增速二阶导为正。周末流传的DS V4的benchmark图，正说明国内模型能力的持续增强。海外Mythos级模型的参数量跳跃增长，我们预期国内模型公司也会参考类似技术路径，提升基模能力。对应将会是算力需求更夸张的增长，#供给弱于需求将会持续存在,且国内会更显（目前字节日均token消耗已超越谷歌)。

相关：金山云、以协创、利通、盈峰、ykd为代表的算力服务公司。

3）应用层面迎来较好的交易期，港股新股的财务数据弹性优于A股，可以多关注调整较多的港股次新标的。

PS：产业政策层面当前可以多关注国七的进展，涉及新车型标定服务的公司有望率先受益。

1）CPU需求会有提升

黄仁勋解释CPU不再只是支持模型，而是开始驱动模型。

需求端升级推动CPU系统价值显著提升。CPU在数据中心中承担前端请求调度、状态管理、多轮任务规划和工具调用等复杂职责，成为整个计算系统的核心中枢。

2）供不应求已体现CPU涨价

Intel和AMD已通知客户，将全系列服务器CPU上调价格，交货周期显著延长。2月以来CPU普遍涨幅在10-15%。

AMD多次强调26年CPU已全面售罄，未来3-5年内数据中心业务年增长率或超60%，短期内需求没有任何放缓或停止的迹象。

供给端刚性加剧短期涨价压力。先进制程产能紧张、封装良率要求提升及材料和物流成本上涨，使高端CPU成本结构上行。

3）国产CPU迎来重要机会

供应链紧张为国产CPU提供了进入市场的窗口，国内企业对本土算力的需求增长，也为国产CPU构建稳定应用场景，逐步形成差异化竞争力和长期产业布局优势。

相关：海光信息、澜起科技、龙芯中科、禾盛新材、中国长城

Claude-Opus4.7 发布，编程、多模态、网安等多项能力显著增强，这一系列改进，#本质目标是【对复杂任务表现的加强】。Github、Windsurf、Harvey等企业客户试用后纷纷给予积极评价。

Opus 4.7价格虽与Opus 4.6 相同，但新的tokenizer导致相同的输入可能会映射到更多的tokens（大约是原先的1.0–1.35 倍），并且在更高的努力级别下，Opus 4.7 会进行更多的思考并输出更多token，有望带来算力需求上行。

Opus 4.7的发布标志着AI大模型复杂长任务落地表现的持续改善，有利于Agent加速落地+提升算力需求，建议关注：

-拥有Coding及Agent能力的大模型厂商：智谱、Minimax、科大讯飞等。

-AI算力产业链，包括：

①AI芯片厂商（海光信息、寒武纪、沐曦股份、摩尔线程等）

②服务器厂商（中科曙光、浪潮信息、工业富联、紫光股份、神州数码、烽火通信等）

③算力租赁厂商：智微智能、协创数据、宏景科技等。

风险提示：技术迭代不及预期风险；经济下行超预期风险；行业竞争加剧风险。

孙行臻/陈泽青

一、Anthropic：

*发布ClaudeOpus4.7

*推出系列新功能：xhigh思考层级；任务预算功能；ClaudeCode增加/ultrareview命令、扩展自动模式

*推出新的CyberVerificationProgram

*ClaudeCode推出routines功能

*发布重新设计的ClaudeCode桌面应用

*发布ClaudeforWord

二、OpenAI：

*发布GPT‑Rosalind，专为生命科学研究打造

*Codex发布重大更新

*称将重点转向企业用户，计划推出“高价值专业工作”新模型

*发布AgentsSDK重大更新

*扩大TrustedAccessforCyber项目，推出GPT-5.4-Cyber

*强调Amazon合作，称与Microsoft在一定程度上限制了为企业客户提供服务的能力

*称Anthropic此前宣布的300亿年化收入存在约80亿美元“高估”

*称Anthropic在算力投入上存在战略失误：OpenAI计划到2030年拥有30吉瓦计算量，而Anthropic预计到2027年底大约为7到8吉瓦

三、Gemini：

*Google与五角大楼谈判，讨论将Gemini部署到机密环境

*GeminiMac桌面版上线，系首次将Gemini引入桌面端

*GeminiCLI推出Subagents功能

*发布文本转语音模型Gemini3.1FlashTTS

四、字节跳动：

*2026Q1，豆包海外版Dola单季下载量7200万次+（环比+47%），累计下载量2亿次+，3月平均DAU近1200万

*火山引擎与BytePlus（海外）同步上线Seedance2.0系列API服务

五、通义:

*宣布开源Qwen3.6-35B-A3B

*发布3D世界模型HappyOyster

*ATH事业群发布旗下首款AI开发工具Meoo

*为控制成本，QwenOAuth取消免费额度

六、智谱：

*由于算力资源紧张，GLMCodingPlan限时退款

七、MiniMax：

*正式上线全球首个云端沙箱Hermes——MaxHermes且MiniMax模型已是HermesAgent中使用量最高的模型之一

*MiniMaxM2.7正式开源，并宣布变更开源使用条款，商业用途需获书面授权

*MiniMaxAgent桌面端功能更新：PocketBeta、ComputerUse

*发布MiniMaxMusic2.6，与MMX-CLI深度优化

*发布MMX-CLI，专为AIAgent设计

北美云计算：增长前景逐渐清晰，Capex ROI担忧迎来缓解

Anthropic营收爆发+毛利率或低于乐观预期、带来云计算庞大需求。Anthropic的年化收入ARR已经从25年底的90亿美元提升至26年4月初的300亿，若保持月度环比增长趋势，26年底将冲击800-1000亿的区间，带来庞大算力需求。其次，25年11月市场预期的Anthropic的26年毛利率将为63%，但当前公司将Claude Enterprise从“高额固定付费席位为主”修改为“低月费+按实际用量付费”，侧面反映当前Tokens调用下对公司毛利率的压力，预计其实际推理算力成本明显高于此前乐观假设。

Anthropic与Coreweave达成多年云服务协议、反映其算力需求从CSP向Neocloud溢出。此前市场担心CSP庞大的AI Capex长周期运营下的ROI，但从目前谷歌云、AWS 26年即将交付的容量来看，仍难以满足Anthropic的算力需求，使得其在26年4月首次开始与CSP之外的新云达成云服务采买合作。也即谷歌云和亚马逊AWS短期内仍有刚性算力供需缺口。

AI云计算供需关系紧张程度加剧为短期边际变化，但中长期CSP的AI PaaS生态构建、提供AI推理阶段云弹性+更高云服务质量将对其AI云商业模式和盈利稳定性改善具有更重要的意义。持续关注CSP提供的算力溢价程度+大模型API调用中来自CSP平台渠道的占比。

1）重点关注谷歌云（此前市场已有增长加速共识）和亚马逊AWS（预期低、Project Rainier自25Q4后大规模向Anthropic交付）。目前彭博一致预期亚马逊AWS 26Q1营收增速为25-26%，亚马逊26年4月年度股东信指出AWS AI云ARR达到150亿；我们预计AWS有望在后续持续上修26年营收增速预期。

2）Coreweave等Neocloud短期将迎来算力供需关系紧张下的盈利弹性，但缺乏丰富而高质量的云生态下中长期利润率担忧仍在。

事件：4月16日，腾讯发布并开源混元3D世界模型2.0，阿里巴巴ATH事业部推出世界模型Happy Oyster。4月17日，“杭州六小龙”之一群核科技在港交所上市。

1）腾讯混元3D世界模型2.0：支持3D资产导出与编辑。支持用户多模态输入，一键生成可漫游世界。新一代模型画面精细度和真实感大幅提升，新增角色模式加强交互性，支持基于图片、视频构建3D数字孪生场景。模型主要亮点在于其能够生成3D资产文件，并能导入到Unity、UE 等游戏引擎进行二次编辑。

2）阿里Happy Oyster：实时构建与交互性能优异。基于原生多模态架构，模型支持多模态输入与音视频联合生成，目前支持漫游（Wander）和导演（Direct）两种模式，主打实时构建和交互性能。模型采用流式生成框架、引入持续状态复用机制，在实时响应、交互性、长时间演化一致性保持等方面表现领先。其中，导演模式下用户可通过文字实时操控剧情走向，支持3分钟/720P视频生成；漫游模式支持1分钟/480P视频生成。

3）群核科技：空间智能第一股，布局具身智能训练。2025年公司实现营收8.2亿元，同比增长8.6%；毛利率提升至82.2%；经调整净利润为5710万元，实现扭亏。公司基于空间场景数据优势，从空间设计软件提供商向空间智能服务提供商转型。空间智能业务方面，公司已发布SpatialVerse空间智能平台，2025年已服务于16家客户，实现营收520万元；2025年，公司推出空间语言模型SpatialLM、空间生成模型SpatialGen。公司已与智元机器人等企业达成合作，将业务拓展至具身智能训练、电商、XR等领域。

资料来源：腾讯混元微信公众号、Happy Oyster官网、群核科技招股书，据公开资料整理，不涉及研究观点和投资建议。

事件：杭州六小龙之一、物理AI龙头群核科技于4月17日登陆港交所，上市首日收涨逾144%。

1）行业空间：中国空间设计软件市场2024年规模约33亿元，预计2029年增至66亿元，5年CAGR约14.9%；全球市场2024年约190亿元，预计2029年增至336亿元，5年CAGR约12%。群核按2024年收入计市占率23.2%，位居中国第一。同时，公司所处赛道正向更广泛的通用设计与可视化市场延伸，2024年中国空间设计软件仅占整体市场的4.4%，行业天花板仍远未触及。

2）公司概况：公司定位云原生空间设计软件厂商，核心产品为酷家乐、Coohom，并向SpatialVerse、空间智能等方向延伸；底层能力主要包括GPU基础设施和AI模型。商业模式以订阅为主，企业客户是收入核心。2023/2024/2025年收入分别为6.6/7.5/8.2亿元，毛利率分别为76.8%/80.9%/82.2%。

3）公司优势：①产品侧，云原生+AI+实时渲染，设计结果可进一步转化为可生产图纸；②链路侧，软件可对接CRM、ERP、CAM、MES、CNC等系统，从设计环节向生产、采购、施工等流程延伸；③底座侧，自建GPU集群支撑高频渲染和AI训练/推理，形成性能和成本优势。

4）经营质量：公司2025年经调整净利润转正至0.57亿元，已基本跨越盈亏平衡点，经营杠杆开始释放。公司增长核心在B端客户，尤其是大客户。2025年B端客户订阅收入6.69亿元，占总订阅收入84.2%；大客户424家，大客户订阅收入3.63亿元，净收入留存率109%，头部客户续费和扩单能力较强。C端更多承担流量入口和转化功能，2025年非付费个人用户转付费转化率提升至9.6%。

5）估值与股权：上市后黄晓煌/陈航/朱皓分别持股14.0%/10.0%/3.82%，创始团队合计约27.8%，同时叠加高瓴、GGV、IDG、顺为、Coatue等机构股东，属于典型VC支持型股权结构。

*公开资料整理，仅作为行业分析参考，不构成任何投资建议！