国产算力更新:海光HSL+华为...
发布者:乐晴
①9月13日,海光信息重大更新正式开放互联总线协议HSL,联合国内各大主流GPU厂商共建互联智算生态。
②9月18日-9月20日,华为将在上海举办全联接大会2025,包括鲲鹏产业峰会、昇腾AI产业峰会以及计算分论坛。
事件:当地时间2025年9月12日,美国商务部工业与安全局(BIS)发布公告,称修订了《出口管理条例》,共将32个实体添加到管制实体名单中。
其中涵盖中国23个实体,包括半导体与集成电路、航天遥感、量子、工业软件/工程软件等领域。大国科技博弈背景下国产化发展大势所趋,以国产AI算力为代表的关键领域成为重点。
国产AI算力龙头开放互联总线,国产化进程不断加速
13日,海光信息在智博会上面向全栈产业伙伴开放CPU互联总线,旨在消除国产CPU与AI芯片之间的壁垒。通过开放CPU内核能力和互联总线,持续完善国产算力生态。
目前海光产业生态合作组织产业协作网络已延伸至6000余家合作伙伴,完成15000余项软硬件测试项目,形成从技术研发到市场拓展的闭环生态。
同时,2025年9月12日,《安全可靠测评结果公告(2025年第3号)》发布,共4款CPU和4款操作系统(2款桌面/2款服务器)入围,国产化进程不断加速。
1)事件:9月14日中美双方在西班牙举行会谈。
①美国施压: 9月13日上午,美国将复旦微等多家中国公司纳入实体名单;
②中国反制: 9月13日下午,中国商务部宣布对原产于美国的进口相关模拟芯片发起反倾销调查。
一句话观点:只看能贯穿这轮行情的大漂亮们!
2)大漂亮怎么选?
①紧紧围绕当前最强的产业趋势-算力(半导体新周期);
②研判产业趋势下最能胜出的个股-大漂亮。
3)两个思路
①能买大漂亮,就买大漂亮!
②市场强时优先预期差,市场弱时考虑确定性!
-算力芯片
海光 (芯机一体国家队,存在较大预期差),配套-华峰测控
寒武纪 (跟踪芯片能力和可获取代工产能的确定性),配套-甬矽电子
-先进代工力
华虹 (寻找先进代工能力预期差) ,配套-龙图光罩
中芯 (跟踪扩产和良率提升的确定性) ,配套-灿芯股份
-光刻机: 各有所好!
-存力
兆易创新 (3D DRAM在AI端侧应用的确定性)
此外,结合当前中美商讨博弈焦点,华虹和杰华特、复旦微、臻镭科技可高看一眼!
我们团队从6月份推荐国产算力以来,走过了6-8月的行情分歧期,8月中旬迎来第一波高潮,在本周全市场都聚焦在海外算力的时候我们坚定提示国产算力,板块持续大涨!
复盘本周,阿里与荣耀签署战略合作协议、推出“高德扫街榜”等,一套“组合拳”振奋国产算力情绪。个股层面,寒武纪定增获证监会批文;海光推进曙光收并购,并发布覆盖面相当广泛的股权激励;芯原股份Q3新签订单自愿披露,复牌强势涨停。
接下来一周依然是国产算力主线。国家发改委9/12日发布《深入实施“人工智能+”行动 为高质量发展提供强大动能》,政策端再添利好。国产CSP大模型崛起,前OpenAI研究员姚顺雨加入腾讯,合理展望腾讯AI加速。美团首款AI Agent产品“小美”公测,搭载自研模型LongCat,#国产二线CSP强势来袭。国产算力beta最后的分歧点——需求,或许从此刻可以开始被重新定义。
更有重磅盛会前有“海光系统互联总线协议开放生态研讨会”9月13日举行,后有“华为全联接大会2025”于下周9月18日-20日举行,我们所一直强调的“AI算力-存力-运力三阶段逻辑”中的“运力”逻辑一触即发。
相信我们可以共同期待国产算力新的高度!
重要意义:海光开放互联协议,一统计算生态
1)互联是高性能计算的必经之路:AI训练及推理需要多个CPU或GPU协同工作,互联协议确保这些组件之间的数据快速、准确传输,例如NVLink和CXL等协议,为GPU与CPU、GPU与GPU之间的高速互联提供了支持。
2)海光信息:全栈自研【海光系统互联总线协议】以及【switch卡间互联技术】。海光提供直连IP、开放协议及定制化指令集,实现与国内AI芯片的高效衔接,推动应用顺畅对接与调用,加快构建开放协同的国产AI算力生态。
3)25年股票激励计划草案发布、增长信心彰显。公司拟授予不超过2068.43万股,占总股本0.89%,首次授予激励对象不超过879人,业绩考核目标以2024年营业收入为基数,首次授予部分2025/2026/2027年营业收入增长率目标值分别为55%/125%/200%。
如何提升有效算力→超节点和推理提速
1)算力趋势一:超节点。
例如NV72超节点(72GPU+36CPU),国内主流CPU仅2家(海光、鲲鹏)、GPU很多家,OEM需要统一标准来实现整个机柜的基础设施统一化。
-海光HSL应运而生
2)算力趋势二:硬件资源不变,通过KV Cache和PD分离来提高推理效率。
但PD分离带来新问题(额外的通信开销、调度复杂度增加),需要统一总线、统一内存访问来解决。
-海光HSL应运而生
3)主流GPU厂商均选择加入海光HSL生态:昆仑芯、寒武纪、壁仞、沐曦、摩尔线程、燧原,以及四大OEM浪潮 中兴 联想 华三。
1)海光开放系统互联总线HSL
HSL是海光信息开放的高带宽低延时的互联总线,此次开放包括总线协议(协议层、传输层、数据链路层)、支持业界通用的物理层(PHY芯片等)、同时还可以通过HSL-I实现拓展,HSL-I可以基于通用PHY与海光的CPU直连,统一CPU内存访问、还可以提供编程的灵活性。海光会在25年Q4发布HSL1.0规范,随后在明年一季度发布设计参考,支持这个生态内的AI芯片、服务器和智能网卡公司更方便的设计
2)HSL总线实现了比PCIe总线更低的延迟和更高的性能
类似于NV-LINK实现了节点间互联、HSL总线可以显著降低PCIe的时延(降低一半),HSL协议支持类似于GH/GB系列新品的C2C互联,也支持通过switch方式进行节点内互联和节点间拓展,可以带来统一的互联总线和相应的高带宽和低延迟、支持全局地址空间和支持的一致性
3)现场众多GPU芯片、服务器厂商和智能网卡公司来场支持
包括寒武纪、昆仑芯、沐熙、摩尔线程、还有浪潮、无锡众芯微(拥有serdes和智能网卡产品)等超过10家企业来到现场共同发布这一总线协议,#我们这认为在国产化趋势的浪潮下、海光HSL协议包括HSL-I的拓展有望帮助海光进一步实现智算服务器中的CPU国产化、加速海光国产CPU未来的增长
事件:9月13日,“海光系统互联总线协议开放生态研讨会”于北京召开,深入解读海光系统互联总线协议,展示开放CPU在系统互联、应用适配及算力协同中的实践成果。
1)CPU互联总线HSL全面开放,性能更强时延更低
根据国芯网报道,海光要面向全栈产业伙伴开放CPU互联总线-HSL,CPU互联总线技术是连接处理器核心与系统其他部分(如内存、I/O设备等)的关键技术,服务器内部CPU到GPU间通信目前最主流的就是PCIe技术。相较于PCIe,HSL 性能更高,时延更低。
2)海光HSL的全面开放,有利于加强与GPU、DPU、OEM、IO、OS等链上伙伴的生态协同
目前昆仑芯、寒武纪、壁仞、沐曦、摩尔线程、燧原等主流GPU厂商,以及浪潮、中兴、联想、新华三四大OEM厂商均已加入海光HSL生态。这些生态伙伴涵盖国产计算产业全栈环节,并且形成了“芯片设计与制造—部件-整机系统—软件生态—应用服务”的开放创新链,共同开展技术攻关、方案优化、应用创新及市场开拓。
3)从开放内核到开放总线,致力于打造国产AI生态
9月5日,重庆智博会上,依托国家先进计算产业创新中心 “AI计算开放架构联合实验室” ,海光信息将开放CPU能力,向产业生态伙伴提供直连IP、开放协议及定制化指令集,实现与国内AI芯片的高效衔接,推动应用顺畅对接与调用。我们认为从开放内核到开放总线,公司致力于打造国产AI生态。
1)HSL协议是什么?
这是海光开放的总线协议,可以实现CPU/GPU/NIC等之间的高速互联,不仅可以让通信传输的速率更高,降低时延,减少协议转换开销,还可以通义全局地址空间和降低编程复杂度。它支持GPU之间的互联(海光自己还会搭配上H-switch芯片实现全互联)和GPU和CPU之间的互联,GPU和CPU之间通过HSL互联是海光的一大特色,实现这个需要参考海光提供的IP,需要GPU和服务器厂商等一同参与。海光会在25年Q4开放HSL 1.0的规范,26年Q1发布HSL IP和软硬件系统的参考设计
2)为什么需要新的总线协议?
一开始GPU、CPU和NIC之间的互联需要通过PCIe协议,时延和速率无法达到AI大模型时代的大规模通信传输的要求(训练需要四种并行,通信开销越来越高,而且到了MoE模型时代,通信开销进一步加大、推理则由于Deepseek的引导进入了PD分离的集群推理时代),NV率先推出NV-LINK协议,先实现了GPU-GPU的直连,然后在24年也通过NVLink C2C实现了CPU与GPU之间的相较于PCIe协议更快的互联,这个产业趋势在友商和各AI芯片公司中已经开始
3)海光的HSL协议有什么特色?
各AI芯片公司也有自己的GPU直连协议,各种XX-link,都希望实现相较于PCIe的更快的GPU互联,但海光在此之外还可以实现CPU与GPU的互联,代替PCIe协议,PCIe协议的速率是600ns,HSL为300ns,同时还支持缓存一致性,协议栈也更简单,只需要硬件设计的时候采用海光即将公开的IP,可能与之能匹配和竞争的只有华为的UB mesh协议
4)海光HSL能实现什么?有望带动CPU在智算服务器的销售、加速CPU进大厂
HSL协议有望带动海光CPU在智算服务器中的销售,海光即将推出海光4号。。。 核心是抢占Intel和AMD的市场
5)这个带来的空间有多大?
假设按照26年国内非华为的智算服务器800亿-1000亿计算,CPU占比5%,市场空间40-50亿,假设按照27年非华为的智算服务器1500亿计算,带来的CPU市场空间75亿,24年海光整体的收入约90亿,增量空间还是很大。
当然海光自己基于HSL协议的超节点也能实现更好的性能,也能带动DCU的销售。
9.18-9.20,华为将在上海举办全联接大会2025,包括鲲鹏产业峰会、昇腾AI产业峰会,以及计算分论坛
预计将发布多模态大模型、AI4Science、AI Agent、开源CANN、Mindspore以及高性能计算相关成果
重点关注:【超节点实践】、【大模型一体机】、【软硬件合作伙伴发布】
Hotchip大会上华为Fellow和海思首席科学家廖恒对超节点【UB-mesh】进行了详细解读,也期待进一步落地实践。
产业链相关:软通动力、中国软件国际、华胜天成、神州数码、润和软件等。
1)AI信创:AI基础设施自主可控大势所趋。9月13日,海光信息在北京宣布向全站产业伙伴开放CPU互联总线协议。CPU互联总线是链接CPU与其他硬件组建的通信通道,其性能直接影响计算机系统的整体效率,有望加强其生态协同。
2)AI出海:本周召开东盟博览会,主题涉及人工智能。中国将帮助东盟国家搭建各自的国家主权大模型,与美国争夺全球AI生态的话语权。广西省有望承担对东盟的算力供给,有关企业将分别承担数据和模型任务。
3)工业信创:工业信创提上日程。东土科技与海光信息成为工业信创核心企业,组成中国工业的芯与魂。东土科技新增加国内半导体设备龙头的规模订单,未来相关领域都被要求全面替换国产工业操作系统,唯一在册产品为鸿道操作系统,市场空间相当可观。
4)AI+:紧扣中国的比较优势,优先部署易于跨行业扩展的AI应用。高伟达AI放贷业务进展顺利,近期有望与蚂蚁金服、各家银行签约落地。能科科技AI应用业绩己开始释放,具身智能业务走向列装模式,按单台套收费,带来巨大收入弹性。
1)英伟达推出专门作为推理的Rubin CPX,支持FP4,1亿美元的算力投入撬动50亿美元的token收入,这个成本收益比惊人。
2)从Oracle展示出了海外大厂从自建算力更多的会去外租算力的趋势。也同样说明了推理时代的到来,因为外租算力可以提供更多的算力弹性以应对推理需求。Oracle模式:自己买卡+集群+软件框架。
3)海光刚刚发了基于软件层面的CPU互联总线,其实可以做卡与卡之间的互联,说明海光的互联能力有明显提升。腾讯下单2w海光是代采购,也下单了2w昆仑芯,寒武纪等待690量产回片。
寒武纪:万亿市值之前无需纠结,从供给格局看,我们判断N+2的扩产节奏仍有超预期空间,接下来更多进展有望浮出水面。另外定增进展不容忽视,期待产业方加持。
芯原股份:周五强势涨停,我们认为是对国内外产业链上下游携手驱动的AI ASIC产业趋势的合理反应。下周继续聚焦“逐点半导体”serdes IP资产情况,以及与当前AI ASIC业务的融合。注意,中报后估值体系调整。
盛科通信:AI算力-存力-运力三阶段逻辑次第演绎,当前是“AI运力”最佳布局点,“让整个超节点的GPU共同组成一个大的GPU,实现互联互通无损耗”是下一轮AI超节点核心逻辑!国产CSP、ODM验证下来盛科都是最优卡位,且未来承接博通当前市场广阔的“国产替代”份额逻辑顺畅!更有Scale Up“通胀”叙事次第展开,盛科通信卡位领先,有望打开千亿市值空间。
兆易创新:周四周五连续触及涨停!公司和快手/H/高通等多家厂商都有合作在推进。之前市场对3D DRAM认知主要集中在端侧(与瑞芯微NPU已获批量订单),但云端的合作仍有巨大预期差。在产业趋势下,公司对接接近3位数的互联网/PC/手机/端侧客户,后续进展是不缺催化的。同时认识到公司在存储端的强稀缺,越来越多的国产SOC厂商在NPU的开发中适配兆易的3D,这是极强稀缺性的表现。
新晋海王海光信息怎么看?不只是补涨!国产GPU环节最容易被忽视的稀缺标的——兼具CPU+GPU+Switch全套芯片布局,采用x86+类CUDA最强生态,背靠曙光做大做强。消息层面强催化!新增互联网大厂订单预期,N+2产能侧预期增强。
其他还看啥?
中芯国际: 传导逻辑最顺,另外重视翱捷科技,重视3D DRAM项目、裕太微新增数据中心业务预期。另外海外算力重点独家弹性PCB公司威尔高 NV链电源PCB进展超预期。
我们认为接下来这一轮“国产算力”行情应当是可以充分参与的大级别行情,相信我们可以共同期待国产算力新的高度!
13、海外算力链跟踪
The Information :英伟达正逐步退出其新兴的云计算业务,该业务曾使其与亚马逊云服务形成准竞争关系。一位知情人士透露,该公司已减少吸引企业使用其名为 DGX Cloud 的云服务的力度。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!