AI大模型+AI应用+Agen...
发布者:乐晴
作为基于Deepseek的工程化创新,Kimi在推理能力上实现重要突破,并在OpenRouter榜单上保持TOP2,是国产模型能力持续强化的体现,也有望助推Agent类应用更进一步。
Unity Software大涨超13%,创逾一年半以来新高,月内累涨近60%;SoundHound AI涨超7%,AppLovin、Tempus AI涨近3%。
7月18日OpenAI直播发布ChatGPT智能体,ChatGPT 现可通过其自有虚拟计算机为用户处理复杂任务,具备自主思考与行动的能力,能够主动从其智能体技能库中选择合适的工具,利用网络完成任务,包括深入的财务研究、填写在线表格、制作幻灯片等。通过工具下拉菜单选择“智能体模式”即可激活功能,虚拟机会实时展示 ChatGPT 的具体操作流程,用户可随时中断并接管浏览器操作。即日起陆续向付费用户推出,Pro 版用户用量近乎不限,其他付费用户每月可用50 次。
技术上ChatGPT智能体是今年OpenAI两个重大突破的自然延续,此前发布的Operator是能够通过远程浏览器与网站互动的工具,能够在网页上滚动、点击和输入文本;DeepRearch是多步骤网络推理工具,擅长分析和总结信息,OpenAI将 Operator与网站交互的能力、深入研究在整合网络信息方面的优势,以及 ChatGPT 的对话能力有机融合,形成一个统一的智能体系统。
ChatGPT智能体多项能力评测达到行业领先水平。《人类的最后考试》评估中ChatGPT智能体在广泛学科领域的专家级问题上取得了 43.1 分的新高;在 DSBench测试评估数据分析和建模等现实数据科学能力时,ChatGPT 智能体在数据分析任务中表现明显优于人类水平;在 SpreadsheetBench 评估模型处理电子表格编辑的表现时,ChatGPT 智能体得分达到 45.5%,Excel Copilot 为20.0%;在内部基准测试中展现了处理1至3年经验投行分析师任务的能力。
我们认为ChatGPT智能体显著提升了大模型在日常和专业场景中的实用性,是Agent产业的一大突破,大模型的核心价值正从能说会道的问答者转变为能具体任务的执行者,有助于AI应用进一步渗透到各生产生活领域。
AI算力:Agent对算力的消耗比Chatbot上好几个数量级。全球算力、国内算力、国产算力
AI应用:先看有变化的公司:快手、金蝶国际、拓尔思、金桥信息、能科科技、慧辰股份、鼎捷数智、360、万兴科技;逐步扩散到有潜力的公司,参考近期报告。
2023年2月Kimi的关注全市场领先,K2再领先。
核心逻辑:
1)KIMI K2的重点不在性能,而在于“下一代范式的起点”,称之为又一个DeepSeek时刻绝不为过。从25.3月开始,海外御三家+国内DeepSeek已经在探索新范式OnlineRL,相信过去一个月听过我路演的领导不会陌生。
2)OnlineRL的核心是足够好的奖励模型,对于开放场景(无标准答案)模型能力提升50%+(当前数值)。但更重要的是,OnlineRL能够迭代奖励模型的基准,实现“基模—奖励模型—基模”的迭代闭环,即左脚踩右脚上天(即理论情况下模型的能力没有上限、Nature报告中其实提到了KIMI的突破在于新的范式)。
3)KIMIK2现在只是preview、并未做Post-Training,当前的测评效果意义有限。我们认为#当前K2版本天然倾向于采用短链(尚未做RL、KIMI团队还在调试),深层推理需要外部框架补充(类Workflow)。
应用整体处于低位
通用型Agent
1)企业级Agent:鼎捷数智、汉得信息、金蝶国际、泛微网络、用友网络、稅友股份、致远互联
2)办公软件:金山办公、腾讯控股(海外组覆盖)、福昕软件、合合信息、万兴科技
垂直场景Agent
1)银行:信雅达、京北方、长亮科技、宇信科技
2)人力:北森控股、科锐国际(商社组覆盖)、北京人力(商社组覆盖)
3)证券: 顶点软件、同花顺、恒生电子、财富趋势、指南针
4)网安:深信服、启明星辰、安恒信息、绿盟科技、三六零、奇安信等
5)教育&法律:科大讯飞、金桥信息、粉笔、视源股份、华宇软件、竞业达、金桥信息
6)医疗:东软集团(与电子组联合覆盖)、卫宁健康、美年健康、创业慧康等
为啥之前不关注,现在又关注了?
Nature7月17日发表文章,指出“K2是另一个DeepSeek时刻”。和R1似曾相识的感觉。
-K2定位:是「基础」模型,「不是推理」模型。
-K2能力:「对标甚至超过」海外GPT、Claude、Gemini同级别的「非推理」模型,Agent/代码能力强。因为是开源的,评价和口碑非常不错。
-K2细节:1T的参数(vs R1的671B),训练数据15.5T tokens,还是「Scaling Law」。架构上几乎复刻DeepSeek-V3架构【#DeepSeek含金量还在提升!后续V4/R2更值得期待了】。#Agent能力强 ,是因为加了很多Agent任务的合成数据到训练中。
注意 :1)虽然是「非推理」模型,但是 Kimi输出长度是普通模型的3倍 ,继续「Scaling law」,和我们 一直强推算力吻合 。2)未来会出多模态和思考模型,值得期待。
-怎么看:软件之前调整较多,人心思涨。叠加凌晨OpenAI发布会,两件事合并发酵。
-怎么选:强β: 三六零、彩讯股份、鼎捷数智、汉得信息、合合信息、泛微网络等
AI落地快:H:讯飞医疗、迈富时、第四范式、北森控股、金蝶国际等;A:硬件:萤石网络。软件:海天瑞声、税友股份、金山办公、星环科技等。
1)AI应用即将进入快速成长期,当前AI应用发展的先决条件已成熟
一方面,信息技术逐代堆叠,算力、网络通讯等基础设施已满足AI发展的需求;另一方面,大模型调用成本大幅下降,带来各种移动应用接入大模型的成本大幅下滑,激发大模型大规模商用潜力。当前AI应用已来到快速成长前夕,AI应用当前已实现成本腰斩、渗透率快速提升、收入验证带动ROI落地,符合即将进入快速成长期的行业特征。
我们认为AI的价值将在应用层面得以实现, AI引用有望复刻传统产品市场格局:传统应用产品中,从应用类型来看,终端应用(包括Tiktok、Zoom、Airbnb、Palantir等)占据软件市场的最大版图。从AI应用的视角来看,当前终端应用仍处在相对蓝海时期,尽管2025年以来空白市场相对缩减,但仍存在海量机会。传统应用中,应用层占据了软件行业收入与现金流的顶层,我们认为,这一趋势同样将在AI领域复刻。
2)为什么要发展AI+:基于我国国情与全球AI产业链特征的人工智能战略
1)中美AI产业存在巨大差异:美国位于全球AI产业链的最顶端,掌控云服务与芯片市场的垄断地位,云基础设施服务市场前八名中美国公司累计市占率超70%;截止至2023年底,美国AI芯片头部企业(NVIDIA、AMD、Intel)累计市占率达80-85%,形成技术壁垒与生态垄断。
而对中国而言,基于我国的数据优势(我国超80%数据来自政府,尚处于未被开发的状态,具有极大经济潜力)、产业链优势(中国具有全世界最完整的产业链)、市场优势(我国具有超大规模市场需求以及丰富的应用场景),让渡上游利润、扩张下游应用才是我国核心优势与AI产业的关键突破口。
2)未来我国将以通用大模型为基、垂直大模型为梁发展AI应用:通用大模型将成为一切AI应用的基石,是算法平权的决定性因素;算法平权后差异焦点转向私域数据,而基于通用大模型叠加私域数据训练出垂直大模型将成为打通AI应用的“最后一公里”。
3)AI+的核心意义在于与传统行业的双向赋能
AI+传统行业的终极发展模式在于AI与传统行业的双向赋能:一方面,AI赋能传统生产行业的各个环节,实现降本增效甚至改变现有生产线的不合理布局;另一方面,行业现存的海量难以变现的数据、以及未来生产过程中持续产生的行业数据将进一步反哺行业AI大模型,实现进一步自我迭代。
1)挖掘垂直场景需求:依托制造业柔性生产、智能家居人机交互、消费领域多模态推荐等众多成熟案例,推动人工智能技术与下游应用痛点的精准对接;
2)构建商业化闭环;
3)强化场景驱动的协同创新:搭建跨行业数据要素流通基础设施,统一多源异构数据接入规范与隐私保护框架。算法平权带来行业龙头强者恒强:随着通用大模型使用成本大幅下降,算法将不再具有差异化,真正差异化将来自企业之间现有的数据、资源差异,而这些差异将被算法平权进一步放大。因此,AI+传统行业将充分利好各传统行业龙头企业,实现“强者恒强”。
大模型降本/开源带来算法平权,行业数据/资源成最大竞争力,
AI+各场景龙头梳理:
AI+数据:海天瑞声、深桑达A;
AI+农业:托普云农;
AI+医疗:嘉和美康、卫宁健康、开勒股份、润达医疗、国新健康、久远银海、塞力医疗、创业惠康、思创医惠、东华软件、医脉通;
AI+教育:科大讯飞、豆神教育、佳发教育、竞业达、拓维信息;
AI+能源:国能日新、国网信通、朗新集团、南网科技;
AI+交通:千方科技、易华录、万集科技、金溢科技、信息发展;
AI+资管:恒生电子、顶点软件;
AI+银行:宇信科技、天阳科技、博彦科技、京北方、长亮科技;
AI+保险:中科软、新致软件;
AI+政务:太极股份、南威软件、新点软件、数字政通、拓尔思;
AI+司法:金桥信息、华宇软件、通达海;
AI+财税:税友股份、中科江南、博思软件;
AI+烟草:中科信息;
AI+港口:盛视科技;
AI+企业服务:金山办公、用友网络、金蝶国际、浪潮数字企业、光云科技、致远互联、泛微网络;
AI+建筑:广联达、品茗科技;
AI+零售:石基信息、焦点科技;
AI+具身:东土科技、能科科技;
AI+工业软件:中望软件、华大九天、中控技术、索辰科技、宝信软件。
风险提示:政策力度与落地不及预期、技术突破不及预期、产品商业化进展不及预期、全球地缘政治风险加剧。
*公开资料整理,仅作为行业分析参考,不构成任何投资建议!