返回话题列表
乐晴行业观察
2026/04/26 22:32
类型 talk 4阅读 1

国产算力更新:DeepSeek...

发布者:乐晴

上周国内外AI模型发布非常密集,海外GPT-5.5与Image-2,国内DeepSeek-V4与MiMo-V2.5,市场的主要关注点还是在DeepSeek-V4上

1) DeepSeek-V4的能力在周五我们也做了评测,结合周末一些更专业的评测整体可以说是达到了国内&开源领先,跟紧海外一线队的水平;API价格方面其实V4-Pro并不算便宜,同时在一些任务测试中消耗的Tokens量也较多,短期V4 API有二五折的优惠,但在后续我们认为V4-Pro主打的还是高价值任务,和V4-Flash会是一个很有性价比的选择

2)DeepSeek-V4对于算力和存力的优化会更多激发新的需求,尤其是在对KV Cache的优化上,随着长上下文任务比例的提升,Agent的并发瓶颈已不仅在计算而在存储端,而DeepSeek-V4的压缩策略有望让更多百万上下文的Agent普及,我们认为这对于行业整体的Token及KV Cache量级会起到正常带动作用,同时对于存算要求的降低也更利好于国产算力的适配

3) MiMo-V2.5相比前代V2.0进步明显,尤其是在Agent调用的场景中有不错的表现,进入国产第一梯队,同时在成本端也作出较多优化,平均价格也压到大部分国产模型的水平;小米模型针对Agent方向特化提升,我们认为可能也是给更多二梯队的玩家做出提示,聚焦单一领域还是有希望在后发进行追赶

以 DeepSeek-V4 今日发布为代表的中国开发者 AI 模型快速迭代,凸显了当前竞争格局的特点。

我们认为市场领先并非 “赢者通吃”,成功的关键因素将更多是商业化策略、持续用户采纳以及通过 API、代币使用和基础设施服务产生收入。

企业或将采取务实的多模型策略,根据对质量、能力和成本的细致评估,为特定任务选择最佳工具。

差异化的技术路径包括腾讯专注于真实应用场景的模型、阿里专注复杂编码与推理的模型等。

DeepSeek-V4 的先进架构信号了更广泛的趋势:技术差距正在缩小,中国头部模型正日益成为其全球顶尖同行的可行替代方案。

这将加剧竞争,为企业提供更多强大且具成本效益的选择,维持对阿里和腾讯的买入评级。

最新动态

2026 年 4 月 24 日,DeepSeek 宣布已正式发布其最新模型 DeepSeek-V4 的预览版本,并在开源开发者平台上线。

这是一款万亿参数混合专家模型,具备成本效益的 100 万上下文长度。

V4-Pro 版本为 1.6 万亿参数(490 亿激活参数),性能可与 GPT-5.4 和 Opus 4.6 的最新表现相媲美。

V4-Flash 版本为 2840 亿参数(130 亿激活参数),面向高效经济的场景应用。

架构升级与优化

具体而言,DeepSeek 指出其 V4 系列模型包含了关键升级:

- 混合注意力架构,结合压缩稀疏注意力与重度压缩注意力,提升长上下文处理效率。

-流形约束超连接技术,增强传统残差连接的效果。

-缪子优化器,实现更快的收敛速度和更高的训练稳定性。

公司表示,在百万 token 上下文设置下,DeepSeek-V4-Pro 所需的单 token 推理计算量仅为 DeepSeek-V3.2 的 27%,键值缓存仅为其 10%。

这一改进至关重要,因为它使公司能够常规支持百万 token 上下文,并使长周期任务和测试时间扩展变得更加可行。

能力与排名

DeepSeek 声称,其 V4-Pro 在丰富的世界知识方面领先所有当前开源模型(Gemini-3.1 除外),并在数学、科学、编码方面击败所有当前开源模型,可与现有顶尖闭源模型相抗衡。

对于 V4-Flash 版本,其在简单智能体任务上的表现可与 V4-Pro 持平。

这两天仔细研读了DeepSeek-V4的论文,还是惊叹于其算法和infra创新,让人甚至忘了同一天GPT-5.5也发布了。做了详细的笔记 。

1)模型能力:通用知识仅落后Gemini-3.1-Pro等海外头部模型,推理能力开源领先/匹敌闭源,代码Agent与 K2.6 和 GLM-5.1 相当(说明Coding确实有数据飞轮,这波小龙虾DeepSeek没怎么赶上)。DeepSeek官方承认,V4的发展轨迹落后于前沿尖端模型约3到6个月 。

2)创新:最核心的bet是1M的上下文 ,实现的主要方法依然是国内擅长的对“Attention算法的精耕细作” 。其实海外闭源御三家都实现了1M,国内做的相对比较少,可能还是出于成本考虑。这次DeepSeek把长上下文的成本也打下来了,V4以2x以上国内其他模型的参数,实现了基本持平的价格。

3)产业影响:昇腾、寒武纪等国产算力Day0适配讨论很充分了 ,后续只会加强。存算方面,确实#单token的计算量和存储量又被打下来了不少 ,但是我们依然坚持杰文斯悖论, 单价下降*用量提升-->总量提升 。而且周五的美股大家也看到,并没有因为V4的降本而受到任何负面影响 ,CPU、光、存储、NV依然强劲。对于国内的 智谱 MiniMax 来说,周五跌幅较大,但是我们认为大模型渗透到各行各业的趋势并没改变,国内开源模型算法可以互通 ,都有很大进步空间。

4)模型未来:这次DeepSeek没有出多模态,其实有点低于预期,但是论文中提了,多模态会有的 。年初讨论比较多的以存代算Engram算法这次也没实现,不过论文也提了,未来Engram也会有的 。另外随着长文本的实现,在线学习 、长任务/多轮次Agent也在加强中。方向很明确了。

开源模型性能与性价比实现双重突破: DeepSeek‑V4系列模型于2026年4月24日正式发布并开源,包含V4‑Pro与V4‑Flash两大版本,均原生支持100万token超长上下文,采用MIT开源协议。其中V4‑Pro参数规模达1.6万亿、激活参数49B,V4‑Flash参数规模284B、激活参数13B,预训练数据量均超32T。性能层面,V4系列在代码、数学、STEM领域达到开源模型顶尖水平,权威评测中超越多款主流闭源模型,长文本处理、Agent能力显著提升,且性价比突出。

华为昇腾950超节点深度适配:V4‑Pro单请求时延低至20ms、多并发吞吐达388TPS@21ms,V4‑Flash 单请求时延低于10ms、多并发吞吐达 4722TPS@20.15ms,可稳定支撑 8K 至 1M 全长度长序列应用,支持万卡级无收敛全互联扩展。华为950超节点支持V4核心优势源于三大底层技术突破:

1)是原生精度加速,全面支持 FP8、MXFP8、MXFP4 格式,在保障精度前提下内存占用降低 50% 以上、算力翻倍;

2)是稀疏访存优化,针对 MoE 模型离散访存特征强化硬件级稀疏访存,破解专家路由带宽瓶颈;

3)是Vector与Cube共享 Memory,创新存储架构消除片上数据搬运开销,显著降低端到端时延。该超节点与模型联合定义架构,系统性解决超长上下文推理的时延、吞吐与成本痛点,完成国产算力对万亿参数大模型的全流程支撑验证。

国产算力全产业链受益:我们认为 :

1)加速高端AI硬件国产替代,为高端封装载板等零部件提供替代空间;

2)超节点规模化放量,带动液冷设备等温控配套需求激增;

3)模型Token调用量提升推动算力扩容,进一步增加载板、液冷等上游环节的增量需求。

相关梳理(不构成投资建议):

算力:海光信息、禾盛新材、寒武纪等;

上游:凌玮科技、德福科技、东材科技、宏和科技、联瑞新材、华正新材、川环科技、飞龙股份等;

第三方芯片测试:利扬芯片;

服务器:中科曙光;

算力租赁:利通电子、盈峰环境、协创数据、东阳光等。

风险提示:政策进展不及预期;下游需求不及预期;人工智能风险等。

赵宇阳 / 万陈鹏

事件:4月24日,DeepSeek-V4公布DeepSeek-V4-Pro和DeepSeek-V4-Flash预览版本正式上线并同步开源

-V4-Pro:Agentic Coding评测已达到当前开源模型最佳水平,体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式;世界知识测评仅稍逊于顶尖闭源模型Gemini-Pro-3.1;数学、STEM、竞赛型代码的测评超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。

-V4-Flash:模型参数和激活更小,提供更加快捷、经济的API服务,推理能力接近V4-Pro。

官方表示【1M(一百万)上下文将是DeepSeek所有官方服务的标配】。DeepSeek-V4在token维度进行压缩、结合DSA稀疏注意力模型,实现最大上下文长度为1M,均支持非思考模式与思考模式,大幅降低了对计算和显存的需求,同时针对Agent能力专项优化。

API价格方面,基于上下文长度在1M的量级,V4-Pro在输入(缓存命中)/输入(缓存未命中)/输出阶段的价格分别为1元/12元/24元;V4-Flash分别为0.2元/1元/2元。官方表示【受限于高端算力,目前Pro服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调】。

DS-V4在token维度进行压缩,文中表示相比于传统方法大幅降低对计算和显存的需求,我们认为这并不是对于算力和存力的不利影响,纵观过往各类新兴设备和模型涌现,工程上算法的改进,只会在未来加大对算力和存力的进一步需求,对于模型性能提升和更大面积应用推广,是大有裨益的。

DeepSeek-V4亮相体现国产算力持续突破,官方表示高端算力是当前瓶颈,我们看好昇腾等国产算力及自主可控板块中长期前景。

-代工:中芯国际、华虹公司、燕东微、晶合集成等

-算力芯片:寒武纪、海光信息、摩尔线程、沐曦股份、壁仞科技、天数智芯、芯原股份等

-封测:盛合晶微、长电科技、通富微电、伟测科技等

-设备/零部件:北方华创、中微公司、拓荆科技、华海清科、芯源微、微导纳米、矽电股份、金海通、精智达、ASMPT、富创精密等

-材料:江丰电子、艾森股份、鼎龙股份、兴福电子、上海新阳、路维光电、清溢光电、龙图光罩等

2026年是国产超节点大规模落地的元年,以华为昇腾为代表的国产超节点有望在新一代MoE模型的推理场景率先落地。国产AI芯片和交换芯片有望通过超节点技术的突破迎来新的增量。

受到生成式AI需求的驱动,服务器CPU率先出现供给短缺和价格上涨,有望进一步驱动国产CPU在数据中心领域的商业化。

我们认为:在新一代国产AI芯片、超节点快速落地的背景下,国内模型侧的算力需求有望更多地向国产算力倾斜。随着国产算力在性能和性价比上不断提升,下游客户在订单层面有望看到实质性进展。行业头部企业有望迎来高确定性增长。

1)高速连接器:华丰科技、航天电器;2)CPU:海光信息、龙芯中科、中国长城;3)互联芯片:盛科通信;4)AI芯片:寒武纪、天数智芯。

算力“铜”道开启:超节点架构引爆高速连接新需求

2026年4月20日,华丰科技披露的投资者交流记录显示,随着AI算力需求爆发,国内互联网厂商正加速布局“超节点”方案,而采用高速线模组已成为明确的技术趋势。

这一架构变革直接导致单套模组价值量提升,推动公司产能进入饱和状态。

为应对确定性需求,公司已提前启动扩产项目。与此同时,作为交换芯片龙头的盛科通信,其一季度预付款项激增375%,同样印证了国产超节点建设带来的备货热潮。这标志着AI基础设施正从单纯的芯片竞赛,转向对高带宽、低延迟互连技术的深度依赖。

1)超节点架构驱动:

AI大模型训练需要突破单机物理边界,构建更大规模的“超节点”计算集群。这导致机柜内部及机柜间的连接需求呈指数级增长,高速铜连接(高速线模组)因其成本、功耗和可靠性优势,成为Scale-up(纵向扩展)互联的关键载体。

2)价值量与需求双升:

随着服务器芯片迭代,卡间带宽提升,连接方案愈发复杂,单套高速线模组的价值量随之提高。同时,华为、阿里、字节等头部厂商的超节点项目储备丰富,将在2026-2027年快速渗透,带来明确的需求放量。

3)供应链备货信号:

本轮投资机遇的核心在于抓住AI算力从“芯片”到“系统”的传导链条。超节点架构的兴起,使得高速互连技术(铜连接、交换芯片)成为新的瓶颈和价值高地。

建议重点关注两类企业:

一是高速连接器龙头,它们直接受益于机柜内部连接需求量和价值量的双重提升;

二是国产交换芯片核心供应商,其备货行为是产业链景气度的先行指标。

以下为公开资料整理,不构成任何投资建议!

2026年Q1公司实现营业收入349.88亿元,环比+4.8%、同比+6.13%;归母净利润13.10亿元,同比-46.58%;扣非后归母净利润9.36亿元,同比-52.16%。毛利率28.28%,环比-1.07pct、同比-6.09pct。

利润受国内运营商业务下降、结构变化毛利率下降影响。Q1算力产品、家庭及个人终端业务双位数增长,算力占比提升至27%;国内网络侧业务受运营商资本开支影响同比下滑。随着结构变化,我们预计全年运营商网络影响将收窄。

为支撑算力等新业务拓展,公司积极备货,期末存货较年初增长10.5%至519.59亿元,合同负债维持高位,实现139.77亿元。

2026Q1:公司实现营业收入1.03亿元,同比+783%; 归母净利润-4759.53万元;经营活动现金流净额-1640.22万元,同比改善57.14%。收入大幅增长主要受益于液冷渗透率提升,冷板液冷收入快速放量。与此同时,公司合同负债达1.08亿元,较期初#+68%,预付款项较期初+31.52%,反映订单备货和项目推进节奏明显提速。当前利润端仍受规模扩张、人员投入、财务费用及减值计提影响,但收入拐点已经清晰出现。

收入爆发的开始,冷板液冷绝对龙头地位强化。报告期内,公司冷板液冷产品收入大幅增长,核心受益于AI算力中心建设加速以及高功率服务器液冷渗透率提升。公司凭借冷板液冷技术先发优势和深厚项目经验, 已为字节跳动、阿里巴巴、腾讯、 百度、京东、美团、快手等终端客户提供液冷解决方案,市场地位持续巩固。

超节点液冷最核心的环节,AI高密度算力加速液冷升级。随着大模型训练和推理集群功率密度快速提升,传统风冷方案逐步接近散热极限,液冷正在从“可选项”变成AI数据中心的“必选项”。公司围绕高密度算力场景,持续完善从数据中心基础设施到服务器冷板的全链条液冷能力,并同步推进高压直流直供技术,可响应大模型训练中的动态负载波动,进一步提升供电效率与稳定性。目前该方案已应用于中科曙光scaleX万卡超集群,并在国家超算互联网核心节点实现规模化试运行。

公司金刚石铜合金打开材料端天花板,单柜功率迈向MW级。公司在先进散热材料端持续突破,首次规模化应用金刚石铜复合材料,相较常规材料导热率显著提升;配合毫秒级精准温控,可有效降低芯片运行温度、减少频率波动与性能损耗。在芯片硬件规格不变的前提下,该方案可实现实测系统计算性能提升约10%,在高密度集群场景下达到甚至超过国际主流水平。更重要的是,公司单机柜功率可突破900KW、迈向MW级,有望提前达成英伟达规划的2028年Feynman架构技术指标。

海外进展乐观,新加坡+青岛协同体系打开增量空间。公司正积极拓展海外液冷市场,已构建“新加坡+青岛工厂”的协同体系。在东南亚地区,公司已落地多个液冷项目;在中东地区,公司已与合作伙伴签署战略合作框架。

2026Q1,公司营业收入为11.16万元,较上年同期降低1.19亿元,同比下滑9.66%。主要是由于上年二季度出售子公司交割完成出表导致公司合并范围变化, 在同一合并范围口径下公司收入 同比增长16.60%。

2026Q1,公司整体毛利率为37.08%,同比提升6.12pct;实现毛利额4.1,4亿元(同比+8.20%)

2026Q1,公司实现归母净利润1.21亿元(同比-37.06%);实现扣非归母净利润8047.57万元(同比-46.38%)。主要是由于报告期内股份支付费用及汇兑损失增加,2026Q1公司股权激励计划产生股份支付费用8605.83万元,同比增加7905.53万元;汇兑损失6371.03万元,同比增加5773.09万元,均系经常性损益项目。#一季度扣除股份支付及汇兑损失影响后的净利润为 27,055.61万元(同比+33.05%)。

2025年全年实现营收350.90亿元(同比+12.05%),归母净利润2.06亿元(同比+14.27%).

2026年Q1,公司实现营业收入81.17亿元,同比增长15.79%,增长稳健;归母净利润为-3.50亿元,同比亏损扩大。

25年全栈智能战略成效显著,业务实现规模突破

计算产品与智能电子业务全年实现营收158.09亿元,同比高速增长22.36%,营收占比从41.26%提升至45.05%。

1)消费电子品牌“机械革命”表现优异,在国内游戏本市场持续保持领先,全年份额稳居行业前三,并在2025年第四季度跃升至行业第二,巩固了国产电竞PC第一阵营地位

2)信创PC&服务器:“软通华方””软通计算机”品牌稳居业内第一梯队,企业级业务围绕昇腾、鲲鹏产品布局,业务覆盖超节点服务器、液冷服务器、AI 服务器及液冷工作站等。先后中标国家税务总局、中国人民银行、中国移动等多个重大项目

传统软件与数字技术服务业务实现营收189.61亿元,同比增长4.64%。围绕AI,公司可提供全栈的基础设施、数据服务、云服务等,预计成为未来增长强劲动力。

在手订单充足。26Q1末公司合同负债达20.4亿元,同比激增152.4%,在手订单充足,为未来收入增长奠定了坚实基础。

硬件业务继续扩张,积极备货。

公司25年底经营性现金流净额为-2.42亿元,为应对原材料价格波动而增加备货,25年底存货余额同比大幅增长90.32%至77.10亿元。26Q1备货继续,26Q1末存货达到98.07亿元。

26Q1利润承压源自淡季+研发投入加大。

1)传统春节假期属于项目交付淡季,影响当期收入确认;

2)公司主动加大在人工智能领域的转型投入,研发费用从去年同期的3.75亿元增至4.10亿元,管理费用也相应增加。

我们看好公司业务布局和全栈智能化提供商卡位。

后续应重点关注

公司AI基础设施“绿色能源 + 算力基建 + Tokens”一体化 AI 算力服务体系

1)承建的粤港澳大湾区公共算力服务平台(韶关公共算力服务平台)正式启动试运营

2)东南区域平潭两岸融合算力中心 1300P 异构算力池全面运营,扩展上海、广东等地高端推理集群

国际化战略2.0,新兴市场进展

公司启动“出海2.0”战略,硬件出海带动软件与服务协同发展。2025年“机械革命”品牌在巴基斯坦成功斩获十万台笔记本电脑采购大单,预计将使公司在当地PC市场份额从不足1%跃升至10%。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!