返回话题列表
乐晴行业观察
2025/08/11 06:28
类型 talk 11阅读 1

华为AI推理+以存代算+物理A...

发布者:乐晴

①华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。

②SK海力士预计,2030年前,AI内存市场都将以每年30%的速度增长。

“以存代算” 技术核心解析:该技术通过将 AI 推理所需的矢量数据从 DRAM 内存迁移至 SSD 闪存介质优化计算效率,核心价值在于缓解先进制程限制(如华为受 7nm 制程制约)、降低对 HBM/GPU 的过度依赖、实现 “存算一体” 系统创新,其本质是存储层扩展(从内存到 SSD),而非 DRAM 的替代品。

全球 “以存代算” 产业趋势:这并非华为独有技术,日本铠侠推进 SSD 赋能 AI 推理,美光推出 AI-SSD 产品线,英伟达等巨头同步布局。华为因受美国制裁无法突破先进制程,转向系统级创新,是其布局该技术的特殊动因。

华为 “以存代算” 硬件突破:采用 DOB 封装技术,突破传统 16 层限制,实现 24/36 层堆叠,单颗芯片达 36TB 容量;推出 palm-SSD 产品,2024 年为 128TB(巴掌大小),2025 年升级至 256TB(密度较普通硬盘高 1000 倍),核心技术支撑包括采用长江存储 232 层 3D NAND 颗粒(单颗粒 1TB),PCB 板集成 8 颗 36TB 或 10 颗 24TB 芯片。

华为关键芯片创新:SSD 主控芯片起数据寻址调度作用(类比电影院座位分配),解决闪存颗粒读写不均导致的性能衰减问题。华为采用海思自研 Hi1812/Hi1822 系列主控芯片,技术突破点在于维持长期读写速度(从物理层限制转为数学优化)、通过均衡磨损算法延长 SSD 寿命。

“以存代算” 产业链:包括华为存储代理商(天源迪科旗下金华威为金牌总代、北交所中建信息)、散热解决方案提供商(红日达);产业映射机会涉及 SSD 主控芯片(联芸科技 / 国科微)、存储模组厂商(江波龙 / 佰维存储等)、NAND 产业链(长江存储生态链企业)等。天源迪科是华为领先级战略合作伙伴,其子公司金华威是华为政企业务总经销商之一,独家代理昇腾训推一体机、OceanStor存储设备等华为核心AI算力产品。宏达电子控股子公司宏达恒芯的主要产品单层瓷介电容、陶瓷薄膜电路等产品在5G光通讯模块、激光模块中应用广阔,目前已经给华为供货。

“以存代算” 核心逻辑与前景:技术哲学为 “存即是算”(记忆能力是智能的组成部分),2024 华为存储精英大会已发布技术路线,东北电子团队连续两年深度追踪。市场空间方面,AI 推理需非易失存储保存中间过程,2025 华为全联接大会将重点推广,华为 AI 三大方向包括昇腾芯片、大规模组网、存储赋能,AI 推理带动的 SSD 需求将持续超越传统存储增长曲线。

华为将在8月12日2025金融AI推理应用落地与发展论坛上发布AI推理突破性技术,有望减少对高带宽内存(HBM)的依赖,提升国产大模型推理性能。HBM凭借高带宽、低延迟优势成为AI芯片标配,但受产能和出口限制影响,国内正探索替代方案,华为此次技术或成关键突破。

据《科创板日报》8月10日报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上发布AI推理领域的突破性技术成果。该成果旨在降低中国AI推理对HBM技术的依赖,通过优化内存管理和计算架构,提升大模型推理性能,并完善国内AI推理生态的关键环节。HBM作为高成本组件,其依赖性的降低将显著减少推理任务中的卡顿和延迟问题。

硬件与性能:华为昇腾系列硬件已实现多项性能里程碑。例如:

Atlas 800I A2推理服务器:在100ms时延约束下,单卡吞吐达808 Tokens/s,适用于生成式大模型推理。

CloudMatrix 384超节点:部署DeepSeek V3/R1模型时,50ms时延下单卡Decode吞吐突破1920 Tokens/s。

软硬协同优化:华为通过昇腾NPU与自研框架(如MindSpore、CANN)的深度适配,实现高效推理。例如,与科大讯飞合作开发的MoE模型推理方案,使吞吐提升3.2倍,时延降低50%。

CANN全面开源:2025年8月,华为开源了CANN(Compute Architecture for Neural Networks),提供从算子开发到推理部署的全栈工具链,支持PyTorch、TensorFlow等主流框架的无缝迁移,显著降低开发者门槛。

盘古大模型协同:华为通过盘古系列模型(如718B参数的Ultra MoE)与昇腾硬件的定制化设计,实现高算力利用率。例如,Pangu Ultra MoE采用仿真先行策略,在昇腾集群上优化了训练和推理效率。

金融场景合作:华为与中国银联等机构合作,探索AI推理技术在金融领域的规模化应用,如智能客服、风险预测等,提升服务效率。

跨行业扩展:昇腾解决方案已覆盖金融、医疗、制造等领域。例如,华为松山湖工厂的智能质检系统精度达99.9%,浙江移动的ChatCRM系统将营销响应时间从3小时缩短至3分钟。

生态战略:华为以“一平台双驱动”(昇腾基础软硬件平台+技术生态与商业生态)为核心,联合高校、企业及开发者,推动AI推理技术的普惠化。目前昇腾开发者社区已汇聚330万开发者,开源模型和工具链加速行业创新。

技术挑战:尽管昇腾芯片已实现7nm工艺量产,但大规模商用仍需解决供应链稳定性问题,同时持续投入研发以应对国际竞争(如英伟达CUDA生态)。

1)硬件与算力基础设施

拓维信息:华为昇腾首批硬件合作伙伴,主导多个智算中心建设,推出昇腾AI训练/推理服务器(如RA5900),适配DeepSeek全系列模型,2025年AI服务器营收占比超20%。

神州数码:昇腾生态最大分销商,推出“神州鲲泰”AI推理服务器,代理DeepSeek开发者套件,昇腾产品线营收占比35%。

中科曙光:国产服务器龙头,为DeepSeek杭州超算提供液冷系统,适配昇腾AI集群算力需求。

中科创达:与华为在 AI 领域深度合作,为昇腾芯片提供软件开发及优化服务。

深南电路:昇腾 910C 封装基板核心供应商,国内唯一能量产 14 层以上 FC - BGA 基板。

兴森科技:昇腾 910C 封装基板主供货商,珠海基地 72 亿元产能专为华为定制。

华正新材:昇腾 910C 高频基材与 ABF 膜供应商,材料性能降低信号损耗 30%,适配高算力场景。

华丰科技:昇腾 910C 高速背板连接器主供货商,市场份额超 70%。

意华股份:昇腾 910C 高速 I/O 连接器供应商,市场份额 50%,技术跻身国际顶尖行列。

英维克:昇腾服务器液冷散热核心供应商,华为业务占其液冷营收超 40%。

申菱环境:昇腾液冷解决方案供应商,与华为共建浸没式液冷方案。

2)软件与系统集成

软通动力:昇腾AI训推一体化平台服务商,支持DeepSeek本地化部署,金融智能体落地中信银行(欺诈识别准确率99.3%)。

润和软件:鸿蒙+昇腾双生态共建者,开发智能座舱AI模块(定点理想、小鹏),边缘计算场景解决方案提供商。

恒为科技:昇腾私域模型训推一体机合作方,BEV-AI架构适配智能驾驶路侧单元,部署超2000套。

诚迈科技:华为软件服务供应商,可能涉及 AI 底层支持。

北信源:在安全领域与华为合作,适配华为生态。

3)行业场景化应用

科大讯飞:核心逻辑星火大模型迁移至昇腾算力,联合DeepSeek开发教育/医疗知识库,语音识别芯片上车问界M9/M7(时延<50ms)。

四维图新:华为ADS 2.0高精度地图供应商,联合开发增量地图生成大模型(效率提升5倍),智驾芯片通过昇腾认证。

广电运通:昇腾服务器代工厂(年产能10万台),AI柜台覆盖20余家银行(人脸识别准确率99.99%)。

4)新兴技术协同

云从科技:人机协同OS深度适配昇腾,金融/安防AI解决方案受益于CANN开源降低训练成本。

拓尔思:通过昇思 MindSpore 兼容性测试,推出 TRS 拓天大模型技术平台。

长亮科技:参与盘古大模型分析框架开发,是金融科技领域头部企业。

佳都科技:联合发布“知行交通大模型训推一体机”,提供智能轨道交通与城市治理解决方案。

GPT5会在生产力工具/类2B场景,尤其货币化上验证自己。25Q1后AI模型两大货币化场景:编程、Deep Research,本次核心提升正是围绕着这两大货币化场景。

超预期:代码能力大幅提升;幻觉大幅降低;有竞争力的接口价格,预计会大幅扩展2B付费市场。

相对符合预期:继续提升数学和推理能力上限;统一了模型的入口。

相对低预期:市场部分预期输入连贯视频理解,或发布最新的视频生成产品sora2,发布会并没有;创意写作能力低于前代模型,指令遵循能力一般;部分用户发现了模型“偷懒”,不开深度思考能力,导致整体模型使用效果下降。

谷歌DeepMind宣布推出通用世界模型Genie 3。基于文本提示,Genie 3可以允许用户以每秒24帧的速度,以720p的分辨率生成长达数分钟的交互式3D环境,Genie 2仅能生成10到20秒。

国内物理AI商业化进程加速,已有场景落地。1)索辰科技:WAIC会议发布具身智能虚拟训练、低空三维物理地图;2)赛意信息:合作逗号科技,物理AI协助实现供应链智能化;3)智微智能:物理AI落地终端,机器人的“大脑”、“小脑”控制方案。

产业链厂商更新:

-能科科技(特种行业AI加速,华为协同卡位优势)

-赛意信息(Agent制造业快速落地,AI订单乐观,新增物理AI布局)

-道通科技(携手华为,深度赋能“AI+巡检”)

1)GPT-5的发布可类比23年11月GPT-4 Turbo的发布,在炒主题的人眼中是利空,在研究产业趋势的人眼中大部分认为是利好

2)周五应用板块的暴跌,或许是1.27的英伟达DS暴击时刻、是4.19的机器人马拉松时刻,短期情绪发泄完后,终将回归理性

3)海外模型不是只有GPT-5,OpenAI显然已经是按消费科技公司的方式打开。后面DeepMind、Anthropic、XAI的黑科技反倒更迎合市场的口味

4)模型侵蚀软件的逻辑属于刚通网的极端叙事,GPT-5发布后做应用的人反而很兴奋。别忘了软件行业的全称是“软件服务”,除了写代码,还有服务

5)本轮AI应用的底层逻辑是-明年AI预算倾斜、-国产模型进步、-AI+政策助力。GPT-5本来也不是这轮行情我们看多的主要因素。

6)关联板块的市场表现上,海外链没跌、港股应用没跌,国产算力没跌,所以应用这里我们依然保持乐观。

根据2025年最新财报和行业动态,美国AI应用领域业绩增长最快的公司主要集中在以下几类,结合商业化速度、财务表现和技术落地能力综合评估如下:

1)头部AI应用公司:爆发式增长

-Palantir(PLTR)

核心领域:企业级AI操作系统(政府+商业)

增长亮点:

2025年Q2美国商业收入同比暴涨93%,总收入首破10亿美元(同比增长48%)。

调整后经营利润率达46%,自由现金流利润率57%,Rule of 40指数高达94%(SaaS行业最高水平)。

客户数同比增长43%,其中美国商业客户增长64%,大客户年均贡献收入7500万美元。

驱动因素:AIP平台(AI Agent)深度嵌入企业流程,实现从数据分析到自动执行的闭环,例如制造业调度效率提升10倍、医疗资源利用率提升2100%。

-AppLovin(APP)

核心领域:AI驱动的数字广告投放

增长亮点:

2025年Q2净利润同比猛增164%,达8.2亿美元,营收超预期(12.6亿美元)。

AI广告引擎AXON 2.0推动广告收入同比大涨71%,占总营收78%。

剥离游戏业务后聚焦AI广告,经营杠杆放大,EBITDA利润率达67%。

驱动因素:微秒级实时竞价系统优化广告ROI,覆盖电商、金融科技等高增长领域。

2)科技巨头的AI业务:规模化变现

微软(MSFT)

核心领域:Azure云+AI服务(Copilot、Azure OpenAI)

增长亮点:

2025年Q4智能云收入299亿美元(同比+26%),Azure增速34%(AI服务需求主导)。

全年净利润首破千亿美元,AI产品订单激增推动Azure年度收入超750亿美元。

谷歌(Alphabet)

核心领域:搜索广告+云AI(Gemini模型)

增长亮点:

谷歌云收入136亿美元(同比+31.7%),Gemini月活用户达4.5亿(Q2新增5000万)。

AI优化广告点击率,拉动搜索业务增长12%。

Meta(META)

核心领域:社交广告+AI推荐

增长亮点:

Q2净利润同比增36%(183亿美元),AI推荐系统提升Instagram/Facebook广告转化率5%。

Meta AI月活破10亿,深度嵌入内容生态。

3)新兴AI应用:垂直领域高速增长

视频生成工具:如Hula(动态肖像视频)年收入923万美元,月活255万(增速21.5%)。

AI写真应用:GIO(商务写真)年收入728万美元,月活502万(增速21.6%)。

虚拟陪伴应用:Rosytalk(AI伴侣)年收入174万美元,月活增速28.7%。

4)结论:增长最快梯队

Palantir & AppLovin:

商业化速度最快,Palantir靠企业级AI Agent落地实现“三高”(增速、利润、现金流),AppLovin凭AI广告引擎拉动净利翻倍。

技术壁垒高:Palantir的Ontology系统、AppLovin的AXON引擎难以短期复制。

科技巨头:依托云生态和用户基数,AI业务增速稳定在20%-30%,但爆发力弱于垂直应用龙头。

提示:Palantir和AppLovin已验证AI应用从“投入期”进入“利润收割期”,其高现金流支撑持续研发,形成增长正循环。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!