AI算力链更新:国产算力+昇腾...
发布者:乐晴
①据The Information,DeepSeek-V4即将推出,V4的推理将运行在昇腾950 PR上。
②今日海光信息将披露2025年报。
DeepSeekV4率先向昇腾开放,打破行业惯例
DeepSeekV4预发版本率先向昇腾开放而非英伟达,这是国产AI芯片首次获得头部大模型厂商的优先适配背书,打破了英伟达率先适配的惯例。
昇腾950PR性能全面突破,迁移成本显著降低
FP8精度算力达1PFLOPS,FP4精度达1.56PFLOPS,显存112GBHBM、带宽1.4TB/s,异构计算架构CANNNext将兼容CUDA,原有英伟达生态代码可低成本迁移。
大厂订单+量产在即,昇腾份额有望跃升
2025全年华为AI芯片出货量81.2万张、市占率20%位居全国第二。随着950PR将于20264月正式启动规模量产,市占率有望进一步提升。950PR全年出货目标75万台,字节跳动、阿里巴巴等互联网巨头已明确采购意向。大厂实质性背书标志着国产AI芯片迈向”好用”。
相关:华丰科技、华正新材、申菱环境、川环科技、航天电器、中航光电、菲菱思科等
风险提示:产能爬坡不及预期;需求不及预期;适配不及预期;大模型进步不及预期
性能生态双突破:华为昇腾950系列产品在性能与生态层面均实现了对现有 AI 算力产品的迭代突破。
1)性能层面,面向 Prefill 与推荐场景的昇腾 950PR 芯片,其搭载的 Atlas 350 加速卡 FP4 精度算力达 1.56P,单卡算力达到英伟达 H20 的 2.87 倍,配套自研 HiBL 1.0 低成本 HBM 内存容量达 112GB,为 H20 的 1.16 倍,内存带宽提升至 1.4TB/s,同时也是当前国内唯一支持 FP4 低精度的推理产品,可实现 70B 参数大模型单卡加载,大幅降低推理延迟。
2)生态层面,华为通过 CANN Next 架构完成了对 CUDA 生态的兼容适配,当前 CANN 已完成架构解耦,安装包从 8 个拆分为 29 个,编译效率提升 58%,同时全量开源开放软件栈,累计支持 50 余个三方开源社区、贡献 650 余个关键特性,实现了 CUDA 系开发者的平滑迁移,打破了英伟达长期依托 CUDA 构建的生态壁垒。
核心硬件支持超节点:依托 “灵衢” 全光互联技术,基于该芯片的超节点可实现内存统一编址与算力的 Scale-Up 扩展,解决了千卡级以上集群的通信瓶颈,让超节点从概念走向规模化商用,推动 AI 基础设施从传统的分布式架构向超节点架构迭代。
我们认为该产品的落地将成为国产算力产业升级的关键催化剂。
1)其通过架构创新弥补了单芯片制程与性能的短期差距,推动国产 AI 算力从技术跟随迈向架构引领,为万亿级大模型训练提供了自主可控的算力底座;
2)其生态兼容能力加速了存量 CUDA 系客户向国产平台的迁移,叠加产业链伙伴的整机适配能力,将进一步打开国产算力的替代空间。
算力:海光信息、禾盛新材、寒武纪等;
上游:延江股份、华正新材、凌玮科技、德福科技、宏和科技、联瑞新材、菲利华等;
服务器:中科曙光;
云计算:首都在线、青云科技;
大厂系:利通电子、协创数据、数据港、东阳光等。
风险提示:政策进展不及预期;下游需求不及预期;人工智能风险等。
赵宇阳/ 万陈鹏
本文是一份关于DeepSeek V4模型发布可能带来的投资机会的内部讨论纪要,内容涵盖了对AI产业链的整体观点、模型侧进展、算力侧分析以及具体的投资标的梳理。
核心观点与投资框架:
中期策略:坚持看多模型和算力,战略性回避应用层。短期若V4发布,应用层可能存在交易性机会。
模型侧估值:提出两阶段估值思路。
第一阶段(未来2-3年):API收入高速增长期,建议采用P/ARR(年化收入倍数)估值,参考OpenAI、Anthropic的50-65倍水平。
第二阶段:收入增速放缓但毛利率提升期,建议采用毛利倍数估值,以反映模型能力差异带来的定价权与盈利水平分化。
算力侧判断:
当前阶段:处于自2025年中开始的算力主升浪尾声,各环节涨价和股价轮动已基本完成,短期波动大。
未来展望:确信将有第二波算力主升浪,催化剂在于市场明确感知到全球Token需求(尤其是Agent应用驱动)的又一次指数级增长。近期字节等公司Token消耗量翻倍是积极信号。
优先GPU、存储、互联;关注CPU涨价预期增强;云服务/IDC为博弹性品种。
应用侧策略(2026年):寻找营收与利润双提速的标的。利润提速源于AI内部降本增效,营收提速代表外部业务机会扩大,两者兼备是脱颖而出的关键。
DeepSeek V4的预期与机会:
发布预期:发布时间临近,灰度测试反馈性能可能追平Claude 3与GPT-4,尤其在代码、多轮检索能力上提升显著。
关键看点:确认其从底层设计与国产算力(华为昇腾、寒武纪)深度适配,而非事后兼容。需关注是训练+推理全栈适配还是仅推理端适配,前者意义更为重大。
两大机会:
国产算力链:若V4基于国产算力训练,将直接大幅拉动国产芯片需求;若仅为推理适配,则逻辑在于V4能力提升推动AI应用渗透,间接增加国产推理需求。产业链传导顺序:芯片 → 服务器/板卡 → 光模块/液冷/连接器 → IDC → 制造/封装。
AI应用:预计对处于底部、筹码结构好的国内AI应用板块形成事件性利好和普涨,但可能仍是交易性机会。需结合年报、季报筛选标的(如税友、金山、鼎捷、汉得、泛微等)。
模型进展详情(海外 vs. 国内):
架构:Transformer架构依然稳定,得到硬件(如英伟达Blackwell架构适配)和算法路线图(Scaling Law加入Agent Scale)的双重确认。
海外模型:Anthropic、OpenAI、Google、xAI、Meta均预计在Q2有重要模型发布,竞争白热化。OpenAI处于战略收缩但预训练已完成;Google端侧模型值得关注;Anthropic因算力压力限制Harness使用。
国内模型:技术路径趋同(MoE架构为主)。各具特色:智谱 Coding能力强、定价对标海外;MiniMax 参数小但性价比高、Agent优化好;Kimi 预训练技术迭代扎实、长上下文与多Agent编排领先;阶跃星辰 全栈能力、可能港股上市;DeepSeek V4 预期四月发布,重点关注其多模态理解能力及国产算力适配深度。
硬件(国产算力)深度分析:
华为昇腾:2026年目标出货100万颗(910约35万,950约65万)。950PR 是重点,性能参数(FP8算力1P,FP4算力2P)、定价(约7.2-7.5万)、产能(中芯国际支持)和测试进展(互联网大厂万卡测试中)均已明确。对比了昇腾、寒武纪、海光等国产卡的理论吞吐量与性价比。
相关梳理(不构成投资建议):
服务器整机:超聚变(未上市)、华鲲振宇、神州数码、软通动力、烽火、宝德。
零部件:连接器(华丰科技、意华股份、航天电器-新切入)、光互联(光迅科技、华工科技)、PCB(深南电路)、Switch(盛科通信)、封装(通富微电)。
结论
DeepSeek V4的发布将是近期关键催化剂,其与国产算力的结合程度将决定对国产算力产业链的拉动强度,同时有望提振AI应用板块情绪。需区分长期产业趋势与短期事件驱动,在算力板块关注产能与性价比核心环节,在应用板块聚焦基本面(营收利润双增)。
通信板块,假期有两个新利好:云南锗业磷化铟扩产、DeepSeek与昇腾进展
①云南锗业:磷化铟单晶片扩产至年产45万片(此前的3倍),有海外客户。4.3日,云南锗业公告在现有产能基础上扩建一条年产30万片(折合4英寸计算,其中包括6000片6英寸)高品质磷化铟单晶片生产线,最终达到年产45万片(折合4英寸)高品质磷化铟单晶片的产能,达到现有产能的3倍。目前公司磷化铟产品客户中有国外客户,办理出口许可后可出口。
我们认为,考虑到全球EML、CW激光器爆发增长,磷化铟衬底预计长期供不应求。云南锗业,此前在磷化铟方面一直追赶住友和通美,近年来公司的产能、良率、产品性能均有很大提升,长期看好。
②科技媒体The Information称,DeepSeek-V4即将推出,V4的推理将运行在昇腾950 PR上。消息还提到了阿里、字节、腾讯等下单昇腾950,以及950PR近期价格上涨。
我们认为,今年以昇腾为代表的国产芯片的性能大概率显著提升。国产模型在国产卡上完全跑通,将成为国产自主可控的标志性事件。对国产算力要有信心,当前昇腾的测试风评很高,豆包大模型日均调用量突破120万亿Tokens,建议重视国产模型+国产芯片齐头并进的大趋势,华丰科技(昇腾高速线模组核心+全平台的AI互联龙头,定增已批,等待锁价中)。
此外,延续之前的观点,海外光通信方梳理:
汇绿生态: 1.6T出货最多的二线光+物料最充足的二线光+coherent最深度的生产端合作伙伴,国内也和DeepSeek、华为、金山云等深度合作。
长光华芯: 100G EML能力领先,MOCVD设备充足,预计27年底达上亿CW/EML产能(产能对标源杰),有望看到各类新客户导入。同时布局硅光芯片制造和薄膜铌酸锂。
德科立: DCI和OCS有望在今年显著加速,公司有望拿到Ciena+诺基亚的DCI代工订单,公司光模块出货顺利。
数据端,国产芯片出货量级已经接近200万卡,供给能力充足
25年国内AI芯片总出货量超400万,国内推理AI芯片出货达到290万卡,同比增速63%,为历史最高增速。25年英伟达国内市占率进一步下降。23-25年,国内AI芯片出货,NV占比从85%-70%-55%。推理芯片看,25年国内出货量NV占比低于50%。
华为仍是国产断层第一,大厂自研ASIC异军突起
25年,华为出货81万卡,市占率达到20%,平头哥出货达到26.5万张位居第二,昆仑芯、寒武纪位列3-4(份额相当),三大黑马奋力追赶,但华为仍为国内断层第一。
能力端,超节点相关的多维技术均起步
参考NV,系统级 "2 年 5–6 倍 " 的增速不是摩尔定律的延续,而是系统能力边界持续外移的累积结果。每一代的核心创新都是向设计空间中引入此前不存在的变量(Tensor Core、NVSwitch、NV-HBI、NVL72 铜缆背板)。单芯片制程红利只贡献了约 2.5 倍,其余的系统级乘数来自超节点范围内的多维联合优化。
26Q1国内超节点网络拓扑、互联协议、机柜设计已经有标准方案。
*网络拓扑,国内预计向Clos全对等网络收敛,交换ASIC是核心增量环节。
*互联协议,总线型UB、HSL领头,以太型各CSP基于以太网自行拓展。
*机柜设计,互联网、服务器、通信厂商均发布标准构型。
硬件打开可能性,软件决定路径连续性与兑现度。
统一内存、通信运行时和 RAS 把这些被打开的系统能力组织成一条可持续演进的软件路径,使新变量能够沿着既有生态被持续吸收,并最终稳定兑现为 Goodput。
因此,我们认为国产算力进入了单卡-系统交替技术突破贡献效率提升的周期,未来的LPO/CPO/OCS、HBM/3D DRAM、infra技术的突破,都可能带来效率提升,实现乘数效应。
曹峥
核心要点
订单前景与行业需求
整体需求表现相当强劲,两家超大规模云服务提供商已开始在西部地区启动新一轮大规模数据中心招标,第三家也在跟进中。
万国数据 500 兆瓦的年度签约目标存在上行风险。
公司预计 2026 年中国全行业签约量可能高达 4-5 吉瓦,而谅解备忘录(MOU)总规模将更大。
人工智能相关需求占新增需求的 70%,主要由国产 GPU 支撑(2026 年预计 1.5 吉瓦,2027 年约 3 吉瓦)。
随着现有合同续约、新产能建设及客户入驻周期推进,万国数据的营收和息税折旧摊销前利润(EBITDA)增长加速预计将从 2027 年下半年启动。
行业竞争与政策环境
在新的电力配额窗口指导下,行业竞争相对温和(价格稳定),行业龙头企业有望巩固市场份额。
上一轮电力配额窗口指导下的申请通过率约为 30%,而万国数据的所有项目均获得批准。
公司认为,即便未来监管机构放宽审批流程,也需以客户需求为支撑。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!