国产算力链更新:超节点+Dee...
发布者:乐晴
①服务器龙头超聚变完成A股IPO辅导。
②DeepSeek-V4 的预览版本上周五上线并同步开源。
③4月26日起,DeepSeek全系列API服务,输入缓存命中的价格降至原有价格的1/10,Pro模型在2026年5月5日前叠加2.5折限时优惠。
④摩尔线程公告,第一季度营收同比增长155.35%。
⑤阿里HappyHorse将于4月27日(今日)开放测试。
⑥世界人工智能大会连接例会(WAIC CONNECT)将于4月27日(今日)举办。
1)2026年是超节点元年,互联网厂商的超节点方案机柜预计于2026年9月左右开始起量。
2)相对传统计算节点,超节点需要计算节点、GPU卡之间实现互联,所以交换芯片、线缆、连接器、铜缆的费用有所增加。超节点方案成本为传统计算节点的2-2.5倍。
3)国内仅5家厂商可做超节点研发和生产,分别是浪潮、新华三、华勤、超聚变和中兴通讯。
4)服务器龙头超聚变完成IPO辅导,辅导机构为中信证券,河南超聚能科技、中国电信、中国移动等多方共同持股。
其它相关:华丰科技、利和兴、远东传动、赛意信息、华胜天成、亚康股份、荣科科技等
客观说性能与GLM不相上下各有侧重:
真实软件工程问题:两者旗鼓相当,各有侧重
-普通难度的 SWE Verified 任务,DS-V4-Pro Max(80.6%)和 GLM-5.1(80.2%)几乎持平;
-更高难度的 SWE Pro 任务,GLM-5.1(58.4%)略高于 DS-V4-Pro Max(55.4%),说明 GLM 在复杂工程场景下有优势;
-终端命令/脚本场景,DS-V4-Pro Max(67.9%)领先 GLM-5.1(63.5%)。
V4最核心亮点在对1M上下文的巨大成本优势
- Pro 版的输入/输出价格(12元/24元)和 GLM-5.1 的输出价持平,输入价(12元)甚至比 GLM-5.1 更高。
-但 Pro 版的上下文支持 1M tokens,远超 GLM-5.1 的 200K,适合超大规模长文本场景。
DeepSeek V4性能比肩顶级闭源模型。
4月24日深度求索发布DeepSeek V4系列模型。V4 Pro性能超越已有开源模型,并比肩世界顶级闭源模型。V4 Flash则提供更具性价比的API服务。DeepSeek V4开创了一种全新的注意力机制,在Token维度进行压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,并且相较于传统方法大幅降低了对计算和显存的需求。
昇腾全面支持DeepSeek V4部署。
昇腾和DeepSeek芯模协同,昇腾950通过融合Kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。
国产算力生态成型,商业化进程加速。
我们认为DeepSeek V4系列模型在多个关键领域实现了对国际顶级闭源模型的全面比肩,并通过极致的效率优化,大幅降低了长上下文的高性能模型的使用门槛,这有望为中小企业和个人开发者提供可负担的AI能力。V4系列模型全面适配华为昇腾芯片,标志着国产AI芯片生态的成熟。V4的架构创新和昇腾的特性形成了深度协同,有望加速国产AI算力的商业化进程。
AI芯片:海光信息、寒武纪、天数智芯、摩尔线程、沐曦股份。
制造:中芯国际、华虹公司、盛合晶微、长电科技、通富微电、芯碁微装、长川科技、伟测科技、三佳科技。
光通信:长光华芯、东山精密、源杰科技、长飞光纤、亨通光电、光迅科技、华工科技。
PCB和材料:方正科技、生益电子、奥士康、深南电路、沪电股份、南亚新材、华正新材、生益科技。
电源和散热:杰华特、晶丰明源、江海股份、海星股份、泰嘉股份、欧陆通、曙光数创、申菱环境、英维克、苏州天脉、思泉新材、鸿富瀚。
连接器:中航光电、华丰科技、瑞可达。
服务器组装:华勤技术、浪潮信息。
中银TMT团队。
1)云天励飞 GPNPU 架构与 IFWA 智能融合软件栈完成 DeepSeek-V4 系列模型关键机制适配验证
2)围绕DeepSeek-V4 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自研 GPNPU 架构及 IFWA 智能融合软件栈,通过 PyTorch 插件 torch_ifwa,完成了面向 GPNPU 平台的关键机制适配验证。
3)CSA/HCA 混合注意力机制为 DeepSeek-V4 面向超长上下文推理效率优化的重要架构创新。需要芯片架构具备对稀疏计算、动态访存和不规则计算模式的支持能力;同时要求软件栈能够快速识别模型结构变化,并将新的计算模式有效映射到目标算力架构之上。
4.)云天励飞 IFWA 智能融合软件栈作用:降低模型迁移与适配成本。模型、推理框架、软件栈与芯片架构之间的协同效率有望进一步提升。
近期催化:
①【Deepseek V4发布】4月24日,Deepseek V4正式发布,国产主流AI芯片企业华为昇腾、寒武纪、海光信息、摩尔、沐曦、昆仑芯、平头哥、天数智芯、壁韧科技完成适配;
②【CPU配比正在提升】4月24日,英特尔法说会显示CPU正重新成为AI时代不可或缺的基础,客户在部署加速器的同时加速部署服务器CPU,过去CPU与GPU的比例是1比8,现在是1比4,并且正在向更好的方向发展。
③【MATCH Act推进】4月23日,美国众议院外交事务委员会推进通过了MATCH Act法案,全称硬件技术控制多边协调法案,是美国对华半导体出口管制的重大立法升级,旨在确保美国与日本、荷兰等盟友在对华半导体设备出口上采取“步调一致”的严格限制。
6、DeepSeek V4发布,国产算力确定性收益,编程、Agent等AI应用受益程度略被低估【东方计算机】
事件:4月24日,DeepSeek官方宣布其全新系列模型DeepSeek-V4预览版正式上线并同步开源,相关模型拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。
旗舰版V4-Pro性能比肩全球顶级闭源模型
V4-Pro性能:
1)Agent能力达到开源模型最佳,交付质量介于Anthropic的Sonnet 4.5与Opus4.6之间;
2)推理性能上,V4-Pro在数学、竞赛型代码、STEM评测中超越所有开源模型,性能比肩顶尖闭源模型;
3)世界知识上则大幅领先其他开源模型,接近Gemini-Pro-3.1。此外,参数量和激活参数更小的V4-flash模型在世界知识储备、复杂任务推理能力上略逊一筹,但在简单任务上与Pro接近,推理经济性和速度方面则具备优势。
百万超长上下文是亮点,有助打开AI Agent等应用边界
基础模型的超长上下文能力能让AI具备全局全量信息感知、长程连续推理和持久记忆能力,提升复杂业务、长文档和多轮推理应用的处理能力,对AI应用的性能和体验有着关键性价值。DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,实现了全球领先的百万长上下文能力的同时,还较传统方法大幅降低了对计算和显存的需求,从而降低推理成本。
国产模型与芯片融合到达新深度
V4模型的技术报告中,DeepSeek官方首次把华为昇腾和英伟达并列写进硬件验证清单,此外,DeepSeek还预计下半年昇腾950超节点批量上市后,V4-Pro的API价格会大幅下调。除了华为之外,寒武纪、海光等国产芯片厂商也官宣完成推理框架对 DeepSeek V4的“day0”适配。我们认为, DeepSeek模型与国产算力芯片的深度优化与适配,有助于明显提升国产算力的性能和生态能力,未来在推理中逐步成为主流选择。
我们认为 DeepSeek-V4模型的发布,将对国产算力在性能和生态起到关键性的推动作用,此外,V4模型超长上下文和推理能力并#继续保持开源,也将对国内编程与Agent类应用产业逻辑和产品迭代提供支撑(此前国内模型公司有将自身顶尖模型闭源化倾向)。
AI算力领域相关“寒武纪、海光信息、沐曦股份-U、天数智芯、华丰科技、曙光数创、神州数码、中科曙光、禾盛新材、优刻得-W、首都在线、网宿科技、亚康股份等。
AI编程与Agent公司相关:卓易信息、税友股份、范式智能、汉得信息、金山办公、合合信息等。
浦俊懿/陈超
2026Q1业绩:#收入利润高增,#主业增长扎实。公司实现营业收入4.11亿元(yoy +59.09%),归母净利润1.51亿元(yoy +54.25%),扣非归母净利润1.50亿元(yoy +57.27%),基本/稀释EPS 1.34元(yoy +54.02%)。Q1归母净利率约36.9%,扣非净利率约36.6%;非经常性损益仅约103.6万元,占归母净利润不足1%,业绩增长基本来自主业。公司将1555万元增值税即征即退列为经常性损益,软件企业政策红利持续兑现。
关键行业信创释放,软件授权+数据库一体机共同放量。公司受益关键行业信息化建设加速推进,能源、金融、交通、运营商等核心行业客户需求持续释放。报告期内,软件产品使用授权业务和数据库一体机业务销售规模提升,共同推动收入、利润、扣非利润全面高增。
研发高投入,产品壁垒继续夯实。2026Q1公司研发投入0.75亿元(yoy +36.84%),研发投入占收入比例18.24%。数据库具备高技术壁垒、高客户黏性和长周期迭代属性,公司持续加码研发,有望强化核心系统、数据库一体机及行业解决方案竞争力。
国产数据库核心,成长韧性持续验证。整体看,公司Q1收入、利润、扣非利润全面高增,业绩含金量突出;关键行业信创需求释放、高研发投入、低负债率和充足现金储备共同支撑长期成长。持续看好公司在基础软件国产替代加速背景下的成长空间。
天风计算机 缪欣君/丁子惠
26Q1公司已实现单季度扭亏。
2025年公司实现营业收入15.05亿元,同比增长243.37%,归母净利润-10.24亿元,同比减亏36.70%;
2026年一季度实现营业收入7.38亿元,同比增长155.35%,归母净利润0.29亿元,实现单季扭亏!
2025年,公司收入主要来自于S5000板卡及集群等,推测25年出货超万卡。
2026年3月新签6.6亿元大订单,S5000持续兑现
毛利率持续提升,受益于产品规模放量!
25年整体毛利率水平达到65.57%,26Q1为67%,持续提升。公司产品交付形式以KUAE集群为主,毛利率的提升验证集群能力的成熟
S5000性能表现优异,下一代花港架构产品在路上!
S5000单卡稠密 AI 算力最高可达 1,000 TFLOPS,具备全精度、全功能通用计算能力。
基于MTTS5000搭建的夸娥万卡级集群已完成部署并实现上线服务,集群浮点运算能力达10 Exa-Flops,Dense大模型训练算力利用率(MFU)达 60%,MoE 大模型训练算力利用率达 40%,有效训练时间占比超过90%,训练线性扩展效率达 95%。
2025年12月,公司在MUSA开发者大会上发布新一代全功能GPU架构“花港”,并同步推出基于该架构的AI训推一体芯片“华山”与高性能图形渲染芯片“庐山”产品路线图。
花港架构支持十万卡集群,进一步实现从FP4到FP64的全精度端到端支持,算力密度提升50%、能效提升10倍,预计于26Q4正式亮相!
预付款项和存货大幅增加!保障供给能力
25年底公司预付款项17.8亿元,yoy+214%,26Q1末达到23.6亿元
25年底公司存货13.3亿元,yoy+106%,26Q1末达到22亿元
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!