小米大模型+端侧AI+Deep...

发布者：乐晴

工业和信息化部总工程师谢少锋表示，制造业是人工智能技术产品落地应用的重要领域。下一步将全力推进人工智能赋能新型工业化，一手抓供给，一手抓应用，推动制造业的全流程、重点行业、重点产品的智能升级。

将加强通用大模型和行业大模型研发布局，加快建设工业领域高质量数据集。

小米开源首个为推理（Reasoning）而生的大模型「Xiaomi MiMo」。

其中MiMo-7B-RL在数学推理和代码竞赛公开测评集上得分超过OpenAI o1-mini以及阿里QwQ-32B-Preview。

去年底，媒体报道小米搭建GPU万卡集群，招募核心AI人才。

MiMo在AI端侧有很强的产品落地价值：出色的7B模型能够很好的在手机和车机等端侧落地；小米作为全终端布局的企业，可以期待AI赋能终端产品提高其产品力。

此前小米大模型团队的工作也主要围绕小模型端侧部署展开，而本次全新大模型团队亮相MiMo, 或代表公司在端侧AI领域的投入和决心，伴随端侧模型的发布，软件、硬件、OS、芯片层面的更新和迭代或加速。

此外预计25年小爱同学或拥有与苹果类似的AI搜索、梳理、摘要功能。

大模型&智驾&机器人一体：此前机器人和AI团队组织架构并未紧密，目前大模型团队资源优势提升明显，智驾和机器人团队一体化后或持续加速智驾迭代能力，过去三年小米智驾投入55亿元，参数端基本追平友商，智驾总算力8.1E FLOPS，后发优势明显。

YU7将于今年6~7月如期发布。

小米汽车3月交付量超过2.9万辆，后续随着二期工厂投产扩充产能上限+YU7发布，小米汽车交付量有望在25H2获得大幅提升。

端侧AI卡位产品和C端优势，汽车携手全系产品向上突破。

在大模型、助手和智驾领域的投入主要用于确保其竞争身位不落后于友商。

在24年底部开始我们关注到伴随主营消费电子业务和AIOT业务的全面向好及手机AI底层叙事的变化，小米或将逐渐加速AI在应用层落地，我们持续看好围绕大模型和智驾端的算力投入，关注相关小米生态链受益公司。

小米开源Xiaomi MiMo，趋势符合我们在此前AI进化论（4）报告中的观点：DeepSeek优化后的蒸馏技术使得更多模型能够部署在端侧，同时在既定算力下推理性能提升，提升用户体验降低企业成本，有望掀起新一轮智能硬件浪潮。

消费电子领域，AI手机/眼镜/耳机/家电/玩具等纷纷接入DeepSeek。

龙头国产SoC公司已经支持部署DeepSeek1.5B-3B蒸馏模型。

模型端侧化趋势下，端侧算力提升成为共识。

SoC芯片升级方面：

1）下一代旗舰芯片AI算力呈现倍数增长，多伴随制程演进；

2）近存计算呼之欲出，创新NPU架构有望解决低延时问题。我们看好通过新一代SoC+NPU的组合，实现7B模型的高效本地化部署。

近期SoC公司一季度惊喜不断。

AIoT领域高景气：1）老应用需求旺盛、存在客户加单情况，2）新应用量产快，SoC公司加快芯片升级迭代，量价齐升。看好SoC芯片受益于端侧AI硬件新一轮创新周期，关注模型端、应用端发布催化。公司层面关注：1）算力龙头直接受益于端侧模型部署，瑞芯微等；2）低功耗龙头通过生态端受益于手机端模型部署或云端连接，恒玄科技等。

2025中国上海VR/AR产业博览会(VRAR EXPO CHINA 2025)将于2025年5月15-16日（周四、周五，共两天）于上海跨国采购会展中心 / 半马苏河国际会议中心（北门）召开。 2025届大会设有南、北两大会场，共六大主题，分别为：纵论XR产业发展、XR空间计算专场、XR+行业应用专场、游戏&影视&大空间内容创作专场、AR+AI智能眼镜专场以及全球XR产业发展论坛。

AI眼镜作为下一代智能可穿戴设备，结合计算机视觉、AI交互、增强现实（AR）等技术，正成为消费级电子产品的热门赛道。

星宸科技AI眼镜芯片SSC309QL正与多家品牌客户对接测试。公司芯片具备通过API（应用程序接口）调用各类大模型及本地端运行轻量化模型的能力，已有适配Transformer多模态大模型的端侧芯片如SSC388。

恒玄科技表示，公司BES2800系列可穿戴主控芯片已量产落地，2025年将在TWS耳机、智能手表、智能眼镜等产品中全面应用。

瑞芯微及兆易创新联合布局的全新端侧NPU有望在Q2发布，以满足端侧推理智算需求。于瑞芯微而言，该产品是3588的有力补充，也有望进一步提升公司在端侧产品的整体解决方案售价；于兆易而言，该产品是公司第一个实际落地的wow产品，不论是实际业务的拓展还是技术路径置信度提升，意义重大。

DeepSeek于4月30日在AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。

DeepSeek-Prover-V2-671B 支持多种计算精度，方便模型更快、更省资源地训练和部署，参数达6710亿，或为去年发布的Prover-V1.5数学模型升级版本。

在模型架构上，该模型使用了DeepSeek-V3架构，采用MoE（混合专家）模式，具有61层Transformer层，7168维隐藏层。同时支持超长上下文，最大位置嵌入达163840，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提高推理效率。 Prover系列模型为数学定理证明模型，采用强化学习增强推理能力。V2模型发布，参数规模打到671B，在数学定理方面的能力进一步增强。

AI大模型推理能力的进一步增强，有利于AI应用的持续落地，可用场景进一步扩张。在此基础上，助力底层算力基础设施亦持续扩张。

*公开资料整理，仅作为行业分析参考，不构成任何投资建议！