GPT5+AI大模型+AI应用...

发布者：乐晴

①当地时间8月7日，OpenAI正式推出新一代人工智能模型GPT-5。

②GPT-5的智能性能远超公司之前的所有模型，在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。

GPT5昨晚发布，我们的一些观点

比较超预期的点

1)大幅减少幻觉，幻觉也是现在我们个人使用AI工具最大的问题

联网搜索时5的回答出现事实错误的概率比 4o 低了45%。独立思考时，出错概率o3低80%

2）价格定的比预期要低

GPT5对所有人包括免费用户开放，Pro用户可获得GPT-5 Pro（更智能版本）

A价格接口输入1.25美元/百万token，输出10美元/百万token

比较符合预期的点（尤其和information等剧透的口径相比

1）确实提升了代码能力

SWE-Bench, SWE-Lancer, Aider Polyglot等SOTA。人类最终测试 42%，SWE 75%。

根据后续实测，代码能力确实提升了，部分任务超过了Claude

2）数学能力提升AIME 94.6%，推理能力提升GPQA 88.4%达到SOTA

3）统一了模型的入口，GPT5自行判断是否需要开启深度思考，之前的模型版本被认为过于复杂

比较低预期的

1）ARC-AGT-2 LEADERBOARD没有超过grok4，只略微由于Claude Opus 4

（ARC任务覆盖了各种抽象逻辑，涵盖多种思维方式，另外IQ测试，人类可以轻松解决但是此前LLM表现不佳）

2）多模态能力只着重加强了语音，之前有部分预期可以输入连贯视频

3）知识截至到2024，而不是更新到2025最新

4）根据后续部分测评，创意写作能力低于前代模型，指令遵循能力一般

以上观点还会不断更新迭代

OpenAI将推理模型（o系列）并入GPT-5，能够自主识别采用快速回答，亦或是深度思考。

GPT-5主要强化了其在编程、文学等方面的能力，相应速度更快，上下文记忆力更强，同时更有人情味（例如用户了解病情细节时，GPT会表示关切）。

同时GPT-5的价格较4o小幅下降，输入从1.9美元/百万token下降到1.25美元，输出从15美元/百万token下降到10美元，显著低于Claude 4 Opus（擅长编程）的输入15美元，输出75美元。

在模型能力提升降速的背景下，我们看到OpenAI把更多精力放在微调模型，强化编程、聊天、问诊等，强化用户感知更强的功能。公司也在不久前发布了GPT Agent。

我们认为，虽然AGI尚未实现，但在大模型更低的价格、更强大的性能和更丰富的“生产力”功能支持下，AI应用端有望获得持续的繁荣。

天风的点评一针见血，价格才是最核心的。GPT-5 API定价为输入1.25美元/百万tokens，较GPT-4 Turbo成本降幅超80%，对比Claude 4 Opus（15美元/百万token）形成碾压级优势！

1）GPT-5亮点：统一的融合模型、大幅度地降低幻觉、超预期的定价，降低使用成本；

2）大模型迭代到当前位置，能力接近或达到专业博士水平。爬山越往后的难度是越大的，#看似一小步其实是一大步、比如幻觉的显著降低、对应用落地其实是非常非常重要的；

3）目前大模型已经能能满足多数场景和领域的应用需求。头部大模型继续攀登AGI顶峰，同时沿途下蛋，这个蛋就是应用端的百花齐放，#今年美股应用公司AI业务ARR合计将超过千亿元、极具规模且在加速；

4）本季度美股AI应用公司业绩几乎全部超预期: Palantir（军工）、Google（搜索/办公）、ServcieNow（管理）、微软（办公/编程）、Shopify（电商）、Duolingo（教育）、Hubspot（营销）、Appian（低代码）、Doximity（医疗）等各领域应用或与应用相关的公司业绩前赴后继的超预期，确认应用货币化的拐点；

5）当前应用端迎来货币化的拐点，与23H1和25Q1不同，思路上要从主题投资的旧框架里走出来，这个阶段的持续性和弹性都会超预期。

1）近期OpenAI动作密集

8月8日凌晨1点，GPT-5正式发布。

OpenAI在新闻稿中写道，GPT-5的智能性能远超公司之前的所有模型，在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。

新闻稿还写道，“GPT-5是我们迄今为止针对健康相关问题的最佳模型，它使用户能够了解并提高自己的健康程度。该模型在HealthBench上的得分明显高于任何先前的模型。”

预期带动国内基模进入下一轮密集迭代期。

8月7日宣布一年内向美国所有行政机构以1美元价格提供ChatGPT企业版，0成本框定份额是对2G市场重视的表现

8月6日开源gpt-oss-120b/20b，性能分别与o4-mini和o3-mini持平，OAI6年来再度开源已反映国内开源模型对其威胁；

消息称OpenAI正在以5000亿美元估值洽谈新一轮股权出售，以最新披露的130e ARR计算对应~40x，国内AI估值仍有上行空间。

2）云厂商Capex持续上修，AI货币化趋势确定

近期美国Google/Meta/微软/AMZ等云厂商资本开支持续上，Palantir/Duolingo/applovin/Hubspot等AI标的业绩持续超预期。

大厂Capex积极反映下游客户对云服务的持续需求，同时AI逐步开始对业务产生促进作用，例如云厂商均提到AI对广告业务的促进，微软亦表述AI带动M365商业版云业务超预期。

中报建议关注AI收入/订单情况，国内进程加速

近期，海内外产业及资本市场在AI应用上产生强烈共振。

1）大模型技术奇点将至：Google、Anthropic等海外厂商持续迭代大模型基础技术，GPT-5推出。大模型技术迭代带来的基础能力跃升有望强化AI应用大规模商业化落地置信度；

2）海外应用商业闭环渐成：Figma、Shopify、Duolingo、Reddit、Palantir、Google等海外上市公司近期股价表现强势，而其背后是自身AI产业迭代及业绩的强有力支撑，海外应用已逐渐形成商业闭环，国内应用我们预计值得期待；

3）政策支持逐步升级：自人工智能大会高层出席至“人工智能+”行动出台，政策层面对AI产业的呵护如影随形。预计后续政策支持有望持续升级加码。

、

*公开资料整理，仅作为行业分析参考，不构成任何投资建议！