返回话题列表
乐晴行业观察
2026/01/14 08:22
类型 talk 16阅读 1

AI链更新:AI应用+算力+A...

发布者:乐晴

①据美国联邦公报,美国放宽了对英伟达H200芯片出口到中国的监管规定。

②阿里巴巴支持的PixVerse发布实时AI视频工具,挑战openAI的Sora。

③GEO及AI应用概念相关浙文互联、人民网、新华网、浙数文化等公司发布公告,表示相关业务尚未形成成熟模式或收入,或不涉及相关业务。

④隔夜热门中概股多数下跌,纳斯达克中国金龙指数跌1.86%。

0113主升浪第二天:

1)会有波动,但一定是波动向上。 本轮计算机春季躁动,我们持续看好应用是最强主线,应用的上行潜力还很大。

2)抱紧核心龙头,汉得/税友/卓易/合合。

现阶段同步关注细分赛道的相对低位龙头,能科/慧辰/同花顺等,相对低位并不改变公司在产业的核心地位,只是资金轮动的过程。

以上不构成投资建议!

杨本鸿/蒋佳霖

AI应用驱动:

1)产业- AI时代入口争夺(广告/电商/医疗等)及变现关键节点;

2)市场- AI应用涨幅远小于算力,而应用爆发预期是算力投入的前提。

什么是核心方向?

一是流量入口变迁(对应广告电商服务商变迁,GEO是其中分支);

二是数据IP(高价值文字语料图片视频版权);

三是AI医疗制药。未来世界模型也会带动游戏创新。

核心关注:大容量+标签(入口变迁/IP/AI医疗制药)

相关梳理,不构成投资建议:

1)流量入口变迁的广告电商服务商机会(包括GEO):易点天下、蓝色光标、三七互娱;

数据IP语料:视觉中国(图片)中文在线(小说)人民网(主流价值)南方传媒(语料);

H核心:AI时代价值提升的流量入口

腾讯控股(微信agent)

阿里巴巴(千问agent)

哔哩哔哩(Z时代短视频)

快手(老铁短视频入口)

Minimax(AI社交入口)

AI医疗制药

1)核心观点

模型层面,国产模型集中度提升,独立模型厂商如DeepSeek、智谱、MiniMax脱颖而出,建议重视2026年模型在技术创新、成本降低层面的进展。

算力层面,国产模型与国产算力相向而行,超节点时代助力集群性能提升,叠加推理放量+训练持续,中国互联网公司需求高增,算力需求持续景气。

应用层面,从简单对话式应用走向多模态、Agent、具身智能广泛落地,建议关注AI多模态、AI医疗、AI财税、AI消费、智能驾驶等场景。

2)模型:国产模型集中度提升,重视2026年在技术创新、成本降低层面的进展

2025年,大模型主要围绕后训练强化学习增加投入,模型应用能力快速提升。国内模型集中度提升,保持自主基座模型研发能力的模型厂商数量持续减少,独立模型厂商如DeepSeek、智谱、MiniMax、Kimi等有较强研发能力的独立模型提供商脱颖而出。

3)展望2026年,国产模型发展依然会从性能和效率两个维度展开:

-性能上,强化学习、长上下文等进一步发展将带动Agent应用价值继续发展,原生多模态、物理世界融合等有望推动新一轮发展范式革命;

-效率上,基础设施优化、线性注意力机制、mHc等架构将持续改善训练和推理成本,带动单位智能成本持续降低。

4)国产模型与国产算力相向而行,供应端新产品与需求端开支增长相辅相成

技术升级:超节点时代助力集群性能提升,以海光信息/中科曙光Scale X640、华为昇腾SuperPOD、浪潮信息SD200为代表,国产算力超节点竞争力迅速提升,全面支撑国产模型。超节点时代的国产算力有望获得显著更多的采购。

需求放量:推理放量+训练持续,中国互联网公司需求高增。阿里巴巴指出其资本开支会在3800亿元的基础上,追加更大规模投资;字节豆包大模型的日均token调用量从24年底的4万亿增长到25年底的50万亿以上;2025年9月元宝日均token调用量已经超越2025年1月总和。2026年中国互联网厂商资本开支有望迎来高增。

5)国产模型与国产算力相向而行,大厂与AI公司均有明确算力国产化路径:阿里巴巴发布Qwen3系列模型,在硬件层面发布磐久128超节点服务器,集成自研的CIPU2.0芯片,实现自身软硬件良好适配。25Q3以来,以DeepSeek V3.1、V3.2模型为代表的国产大模型持续发布,DeepSeek模型所支持的UE8M0、TileLang等技术全面拥抱国产算力。

6)从简单对话式应用走向多模态、Agent广泛落地

此前,AI的应用主要集中于Chatbot、Coding、搜索、客服等场景,伴随模型能力提升,未来AI的应用将更多走向广泛的多模态、Agent、具身智能等场景。

多模态:多模态产业的奇点在理解端而非生成端,主流模型正从“模块化”转向“原生多模态”架构,这是解决AI理解瓶颈、驱动产业价值跃迁的奇点。建议关注万兴科技、阜博集团、美图公司、OCR龙头等。

-AI医疗:2026年1月8日,OpenAI 重磅推出ChatGPT Health;2025年12月,蚂蚁健康举办AI战略及品牌升级发布会,“蚂蚁阿福”成为面向C端的AI医疗现象级产品。推荐京东健康、阿里健康、讯飞医疗科技。

-AI财税:财税管理具有票账税流程繁杂、政策变化快、合规要求高等特点。通过AI赋能合规咨询等方式,财税一线服务人员+AI Agent+合规专家共同作业,合规咨询等场景有望实现高价值突破。推荐税友股份。

-AI消费:大消费领域具有人机交互程度高、软件品类繁杂、轻量级应用多等特点,天然适合AI应用场景落地。以电商SaaS为例,AI具体场景如AI客服、AI数据分析、AI美工、AI营销等在电商的应用前景广阔。推荐聚水潭、光云科技。

- 智能驾驶:参考Forbes报道,特斯拉最新无人驾驶出租车Cybercab将于2026年4月份开始量产。国内来看,如文远知行、小马智行、萝卜快跑等均已开启全无人商业化运营,在部分地区形成较为成熟的商业模式。。

海光信息、浪潮信息、京东健康、讯飞医疗科技、文远知行、聚水潭、万兴科技、税友股份、阜博集团等。

近日,谷歌宣布联合Shopify、沃尔玛等零售巨头,试图为AI购物时代建立一套统一的操作系统,开源专用于电商领域的AI智能体标准UCP。UCP可以让智能体与各类系统在购物全流程的每个环节实现顺畅互通,AI电商时代已至。

电商SaaS品类繁多,主要品类包括ERP、CRM、HCM、财务管理、建站管理、营销管理、数据分析等,AI为电商SaaS带来广阔机遇,如AI客服、AI选品比价、AI数据分析、AI美工、AI营销等在电商的应用前景广阔。此前,阿里亦加速开启AI与电商场景融入,AI有望重塑电商形态。产业链相关:聚水潭、光云科技、焦点科技、迈富时、汉朔科技、石基信息等。

特朗普政府修订了美国政府批准向中国买家出口英伟达公司 H200 人工智能芯片的标准。

美国商务部将逐案审查向中国出口 AI 芯片的申请,许可要求包括证明美国国内处理器供应充足。

寻求出口批准的公司必须满足某些规定,包括限制对中国的芯片出货量不超过为美国市场生产产品总量的50%,还必须"采用严格的客户身份识别"程序,以防止技术被未经授权使用。

本周告知部分科技公司,仅会在特殊情况下批准其购买英伟达 H200 人工智能芯片,例如用于大学研发实验室,据两位直接知情人士透露。

最新沟通显示,正强化立场,拒绝向这家美国芯片巨头重新开放市场。

最新指令表明,可能已得出结论,保护国内芯片产业比让本土人工智能开发者获得先进的外国计算芯片更为重要。

他们告诉一些科技公司,除非"必要",否则不应购买这些芯片,但在描述何为"必要"时却语焉不详。

目前尚不清楚企业将如何遵守这一指令,据两位知情人士透露,计划与更多公司召开额外会议,传达采购指令,但尚不清楚这些会议是否会提供任何新的指导。

近期市场陆续交易26年国产算力上量逻辑,我们认为26年作为国产先进制程产能放量和超节点商用以及国产ASIC商用的元年,国产算力产业链将迎来历史性机遇。

需求端国产云商陆续传出供应链长期框架订单,配合云capex规划继续增长,我们预计未来几年国产需求将持续饱满。

26年将是国产超节点上量元年,目前已有大量国产厂商发布新一代超节点方案,华为Atlas 950/960,搭载8192/15488张算力卡,曙光scale x 640,沐曦、昆仑芯、阿里盘久等均有超节点布局。

此外,ASIC在端云两侧有着重要运用,在模型适配上较通用卡更有优势,目前国产ASIC在核心厂商已经历多轮内部完善,即将迎来产品点亮以及新一代芯片预研,节奏有望超预期。

短期来看行业亦有春季国产模型迭代催化,#综上全面看好国产算力,国产算力产业链核心:芯原股份、伟测科技、华丰科技、寒武纪、中芯国际、华虹、海光、沐曦、摩尔、壁仞等。

阿里2C事业群持续发力,阿里“云+AI+应用”生态加速落地

2025年底,蚂蚁刚刚在AI领域连落两子。首先是灵光上线,6天斩获200万用户,展露爆款潜质。紧接着,蚂蚁阿福开始了地推模式,从单一医疗问答跨向全场景健康陪伴,正式切入健康陪伴大赛道,并迅速杀入国内AI应用前五。

就在外界还在消化这些密集动作之际,蚂蚁又低调推出了下一张牌:呜哩。多方信息显示,这款产品出自蚂蚁内部新近整合的AGI组织InclusionAI,目前处于测试阶段。

阿里算力:宏景科技、数据港、欧陆通、英维克、中恒电气、亚康股份、浪潮信息、华勤技术、紫光股份等;

阿里应用:

AI法律:通达海、金桥信息

AI健康:阿里健康、卫宁健康

AISaaS:光云科技、石基信息、税友股份、美登科技、安恒信息、超图软件、新华都、千方科技等

AI金融:恒生电子、高伟达、协鑫新能源

AI能源:协鑫新能源、协鑫能科、朗新集团

风险提示:AI落地不及预期,行业竞争加剧

国联民生计算机 吕伟

根据海外Global Semi Research最新研究,谷歌26年TPU总产能430万颗:V6 15万颗,V7 135万颗,V8AX 240万颗,V8X 40万颗;经多方验证,此前产能下修至300万颗的传闻可信度较低

光模块:在scale up (ICI) 网络,TPU V8搭配1.6T光模块确定性较强,V7 800G/1.6T混用,V6 400G/800G混用;在scale out (DCN) 网络,TPU V8预计搭配800G NIC,V7 400G NIC,V6 200G NIC。26年新版TPU出货占比提升,显著带动1.6T/800G需求,另外目前在谷歌的训练推理环节,仍然使用较多NV卡,同样对应高速光模块需求。

OCS:V6/V7/V8单一机柜内TPU数量仍然保持在64卡,延续4*4*4 cube架构,光铜配比不变;V6/V7/V8 Superpod集群内TPU数量保持在9216卡,对应144个机柜,搭配48台320端口OCS全光交换机;26年谷歌OCS仍以MEMS方案为主,不排除小批量试用其他方案

MPO:为降低MEMS array制作难度,尽可能减少光通道数量,TPU搭配BiDi光模块实现单纤双向传输;因此我们认为,谷歌MPO的主要应用场景为TPU/NV卡集群的scale out短距离互连;根据我们最新产业链调研,受上游光纤涨价影响,MPO供应商在和北美CSP谈涨价事项,涨幅15%-20%

综上,重视原有及潜在供应商投资机会。不构成投资建议!

光模块/AOC:中际旭创、新易盛、长芯博创

MPO:长芯博创

OCS:腾景科技

东北通信团队

近期美股AI推理龙头Akamai大涨,当前海内外AI推理均已进入新台阶

模型不会天天训练,但每天都在推理。

根据QuestMobile数据,2025年国产大模型豆包、DeepSeek、元宝、千问等周活用户分别突破1.5/0.8/0.2/0.08亿人,灵光App日活跃用户规模实现7倍增长。

快速增长的用户叠加成本差异,使推理层价值愈发凸显。训练涉及海量数据和复杂算法,需要消耗大量的计算资源,因此训练成本属于CAPEX,而推理成本则属于OPEX。

在一个拥有庞大用户群体的智能语音助手应用中,每天可能会处理数以亿计的语音请求,每一次请求都需要模型进行推理,长期累积下来,全年推理的OPEX可能会逼近甚至超过一次性的训练成本。

推理不是简单地“跑一次 forward pass”。

模型推理,远比学术实验复杂:它是异构计算+多租户调度+大缓存工程的结合体,涉及硬件、软件和系统的全链路优化。其本质更接近在线支付结算引擎。

在线支付作为全球常用的结算系统,全球日均交易额达数十万亿。在线支付结算领域普遍采用的TCC事物模型, 而推理系统同样需要类似的容错设计,即推理 = 分布式交易系统,不是简单的 ML infer。

根据technavio统计预测,29年全球推理市场有望突破2189亿美元,24~29年CAGR~20%。AI 的战场已经从“做大模型”转向“卖推理能力”。过去拼参数、拼对话流畅度的时代结束,现在拼的是“AI 能不能给出可收费、可验证的专业答案”,AI推理侧核心:网宿科技;海外AI推理:首都在线等。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!