小米大模型+端侧AI+Deep...
发布者:乐晴
工业和信息化部总工程师谢少锋表示,制造业是人工智能技术产品落地应用的重要领域。 下一步将全力推进人工智能赋能新型工业化,一手抓供给,一手抓应用,推动制造业的全流程、重点行业、重点产品的智能升级。
将加强通用大模型和行业大模型研发布局,加快建设工业领域高质量数据集。
小米开源首个为推理(Reasoning)而生的大模型「Xiaomi MiMo」。
其中MiMo-7B-RL在数学推理和代码竞赛公开测评集上得分超过OpenAI o1-mini以及阿里QwQ-32B-Preview。
去年底,媒体报道小米搭建GPU万卡集群,招募核心AI人才。
MiMo在AI端侧有很强的产品落地价值:出色的7B模型能够很好的在手机和车机等端侧落地;小米作为全终端布局的企业,可以期待AI赋能终端产品提高其产品力。
此前小米大模型团队的工作也主要围绕小模型端侧部署展开,而本次全新大模型团队亮相MiMo, 或代表公司在端侧AI领域的投入和决心,伴随端侧模型的发布,软件、硬件、OS、芯片层面的更新和迭代或加速。
此外预计25年小爱同学或拥有与苹果类似的AI搜索、梳理、摘要功能。
大模型&智驾&机器人一体:此前机器人和AI团队组织架构并未紧密,目前大模型团队资源优势提升明显,智驾和机器人团队一体化后或持续加速智驾迭代能力,过去三年小米智驾投入55亿元,参数端基本追平友商,智驾总算力8.1E FLOPS,后发优势明显。
YU7将于今年6~7月如期发布。
小米汽车3月交付量超过2.9万辆,后续随着二期工厂投产扩充产能上限+YU7发布,小米汽车交付量有望在25H2获得大幅提升。
端侧AI卡位产品和C端优势,汽车携手全系产品向上突破。
在大模型、助手和智驾领域的投入主要用于确保其竞争身位不落后于友商。
在24年底部开始我们关注到伴随主营消费电子业务和AIOT业务的全面向好及手机AI底层叙事的变化,小米或将逐渐加速AI在应用层落地,我们持续看好围绕大模型和智驾端的算力投入,关注相关小米生态链受益公司。
小米开源Xiaomi MiMo,趋势符合我们在此前AI进化论(4)报告中的观点:DeepSeek优化后的蒸馏技术使得更多模型能够部署在端侧,同时在既定算力下推理性能提升,提升用户体验降低企业成本,有望掀起新一轮智能硬件浪潮。
消费电子领域,AI手机/眼镜/耳机/家电/玩具等纷纷接入DeepSeek。
龙头国产SoC公司已经支持部署DeepSeek1.5B-3B蒸馏模型。
模型端侧化趋势下,端侧算力提升成为共识。
SoC芯片升级方面:
1)下一代旗舰芯片AI算力呈现倍数增长,多伴随制程演进;
2)近存计算呼之欲出,创新NPU架构有望解决低延时问题。我们看好通过新一代SoC+NPU的组合,实现7B模型的高效本地化部署。
近期SoC公司一季度惊喜不断。
AIoT领域高景气:1)老应用需求旺盛、存在客户加单情况,2)新应用量产快,SoC公司加快芯片升级迭代,量价齐升。看好SoC芯片受益于端侧AI硬件新一轮创新周期,关注模型端、应用端发布催化。公司层面关注:1)算力龙头直接受益于端侧模型部署,瑞芯微等;2)低功耗龙头通过生态端受益于手机端模型部署或云端连接,恒玄科技等。
2025中国上海VR/AR产业博览会(VRAR EXPO CHINA 2025)将于2025年5月15-16日(周四、周五,共两天)于上海跨国采购会展中心 / 半马苏河国际会议中心(北门)召开。 2025届大会设有南、北两大会场,共六大主题,分别为:纵论XR产业发展、XR空间计算专场、XR+行业应用专场、游戏&影视&大空间内容创作专场、AR+AI智能眼镜专场以及全球XR产业发展论坛。
AI眼镜作为下一代智能可穿戴设备,结合计算机视觉、AI交互、增强现实(AR)等技术,正成为消费级电子产品的热门赛道。
星宸科技AI眼镜芯片SSC309QL正与多家品牌客户对接测试。公司芯片具备通过API(应用程序接口)调用各类大模型及本地端运行轻量化模型的能力,已有适配Transformer多模态大模型的端侧芯片如SSC388。
恒玄科技表示,公司BES2800系列可穿戴主控芯片已量产落地,2025年将在TWS耳机、 智能手表、 智能眼镜等产品中全面应用。
瑞芯微及兆易创新联合布局的全新端侧NPU有望在Q2发布,以满足端侧推理智算需求。 于瑞芯微而言,该产品是3588的有力补充,也有望进一步提升公司在端侧产品的整体解决方案售价;于兆易而言,该产品是公司第一个实际落地的wow产品,不论是实际业务的拓展还是技术路径置信度提升,意义重大。
DeepSeek于4月30日在AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。
DeepSeek-Prover-V2-671B 支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。
在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。 Prover系列模型为数学定理证明模型,采用强化学习增强推理能力。V2模型发布,参数规模打到671B,在数学定理方面的能力进一步增强。
AI大模型推理能力的进一步增强,有利于AI应用的持续落地,可用场景进一步扩张。在此基础上,助力底层算力基础设施亦持续扩张。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!