返回话题列表
乐晴行业观察
2025/08/08 07:49
类型 talk 11阅读 1

GPT5+AI大模型+AI应用...

发布者:乐晴

①当地时间8月7日,OpenAI正式推出新一代人工智能模型GPT-5。

②GPT-5的智能性能远超公司之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。

GPT5昨晚发布,我们的一些观点

比较超预期的点

1)大幅减少幻觉,幻觉也是现在我们个人使用AI工具最大的问题

联网搜索时5的回答出现事实错误的概率比 4o 低了45%。独立思考时,出错概率o3低80%

2)价格定的比预期要低

GPT5对所有人包括免费用户开放,Pro用户可获得GPT-5 Pro(更智能版本)

A价格接口输入1.25美元/百万token,输出10美元/百万token

比较符合预期的点(尤其和information等剧透的口径相比

1)确实提升了代码能力

SWE-Bench, SWE-Lancer, Aider Polyglot等SOTA。人类最终测试 42%,SWE 75%。

根据后续实测,代码能力确实提升了, 部分任务超过了Claude

2)数学能力提升AIME 94.6%,推理能力提升GPQA 88.4%达到SOTA

3)统一了模型的入口,GPT5自行判断是否需要开启深度思考,之前的模型版本被认为过于复杂

比较低预期的

1)ARC-AGT-2 LEADERBOARD没有超过grok4,只略微由于Claude Opus 4

(ARC任务覆盖了各种抽象逻辑,涵盖多种思维方式,另外IQ测试,人类可以轻松解决但是此前LLM表现不佳)

2)多模态能力只着重加强了语音,之前有部分预期可以输入连贯视频

3)知识截至到2024,而不是更新到2025最新

4)根据后续部分测评,创意写作能力低于前代模型,指令遵循能力一般

以上观点还会不断更新迭代

OpenAI将推理模型(o系列)并入GPT-5,能够自主识别采用快速回答,亦或是深度思考。

GPT-5主要强化了其在编程、文学等方面的能力,相应速度更快,上下文记忆力更强,同时更有人情味(例如用户了解病情细节时,GPT会表示关切)。

同时GPT-5的价格较4o小幅下降,输入从1.9美元/百万token下降到1.25美元,输出从15美元/百万token下降到10美元,显著低于Claude 4 Opus(擅长编程)的输入15美元,输出75美元。

在模型能力提升降速的背景下,我们看到OpenAI把更多精力放在微调模型,强化编程、聊天、问诊等,强化用户感知更强的功能。公司也在不久前发布了GPT Agent。

我们认为,虽然AGI尚未实现,但在大模型更低的价格、更强大的性能和更丰富的“生产力”功能支持下,AI应用端有望获得持续的繁荣。

天风的点评一针见血,价格才是最核心的。GPT-5 API定价为输入1.25美元/百万tokens,较GPT-4 Turbo成本降幅超80%,对比Claude 4 Opus(15美元/百万token)形成碾压级优势!

1)GPT-5亮点:统一的融合模型、大幅度地降低幻觉、超预期的定价,降低使用成本;

2)大模型迭代到当前位置,能力接近或达到专业博士水平。爬山越往后的难度是越大的,#看似一小步其实是一大步、比如幻觉的显著降低、对应用落地其实是非常非常重要的;

3)目前大模型已经能能满足多数场景和领域的应用需求。头部大模型继续攀登AGI顶峰,同时沿途下蛋,这个蛋就是应用端的百花齐放,#今年美股应用公司AI业务ARR合计将超过千亿元、极具规模且在加速;

4)本季度美股AI应用公司业绩几乎全部超预期: Palantir(军工)、Google(搜索/办公)、ServcieNow(管理)、微软(办公/编程)、Shopify(电商)、Duolingo(教育)、Hubspot(营销)、Appian(低代码)、Doximity(医疗)等各领域应用或与应用相关的公司业绩前赴后继的超预期, 确认应用货币化的拐点;

5)当前应用端迎来货币化的拐点,与23H1和25Q1不同,思路上要从主题投资的旧框架里走出来,这个阶段的持续性和弹性都会超预期。

1)近期OpenAI动作密集

8月8日凌晨1点,GPT-5正式发布。

OpenAI在新闻稿中写道,GPT-5的智能性能远超公司之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。

新闻稿还写道,“GPT-5是我们迄今为止针对健康相关问题的最佳模型,它使用户能够了解并提高自己的健康程度。该模型在HealthBench上的得分明显高于任何先前的模型。”

预期带动国内基模进入下一轮密集迭代期。

8月7日宣布一年内向美国所有行政机构以1美元价格提供ChatGPT企业版,0成本框定份额是对2G市场重视的表现

8月6日开源gpt-oss-120b/20b,性能分别与o4-mini和o3-mini持平,OAI6年来再度开源已反映国内开源模型对其威胁;

消息称OpenAI正在以5000亿美元估值洽谈新一轮股权出售,以最新披露的130e ARR计算对应~40x,国内AI估值仍有上行空间。

2)云厂商Capex持续上修,AI货币化趋势确定

近期美国Google/Meta/微软/AMZ等云厂商资本开支持续上,Palantir/Duolingo/applovin/Hubspot等AI标的业绩持续超预期。

大厂Capex积极反映下游客户对云服务的持续需求,同时AI逐步开始对业务产生促进作用,例如云厂商均提到AI对广告业务的促进,微软亦表述AI带动M365商业版云业务超预期。

中报建议关注AI收入/订单情况,国内进程加速

近期,海内外产业及资本市场在AI应用上产生强烈共振。

1)大模型技术奇点将至:Google、Anthropic等海外厂商持续迭代大模型基础技术,GPT-5推出。大模型技术迭代带来的基础能力跃升有望强化AI应用大规模商业化落地置信度;

2)海外应用商业闭环渐成:Figma、Shopify、Duolingo、Reddit、Palantir、Google等海外上市公司近期股价表现强势,而其背后是自身AI产业迭代及业绩的强有力支撑,海外应用已逐渐形成商业闭环,国内应用我们预计值得期待;

3)政策支持逐步升级:自人工智能大会高层出席至“人工智能+”行动出台,政策层面对AI产业的呵护如影随形。预计后续政策支持有望持续升级加码。

*公开资料整理,仅作为行业分析参考,不构成任何投资建议!