**Anthropic发布Cl...
发布者:麦子
**Anthropic发布CluadeOpus4.8,模型安全可靠性加强**
事件:5月29日,Anthropic正式发布CluadeOpus4.8,模型在Opus4.7的基础上进行全面改进,在各基准测试中表现更佳。Opus4.8在编程相关的测评中,E-bench-Pro得分69.2%,远高于GPT-5.5和Gemini-3.1-Pro。在Terminal-Bench-2.1上,Opus4.8得分74.6%,低于GPT-5.5的78.2%。模型最突出的改进之一是诚实性,面临不确定性时不会妄下结论、忽略其编写代码缺陷的概率约为前代模型的四分之一。错误对齐行为(如欺骗或配合滥用)发生率显著低于Opus4.7,与ClaudeMythosPreview相当。预计在未来几周内,Anthropic会发布Mythos级别的模型。 最新估值:Anthropic完成650亿美元H轮融资,由AltimeterCapital、Dragoneer、Greenoaks和SequoiaCapital领投,投后估值达到9650亿美元。 简评: Anthropic预告将在数周内发布超越Opus的Mythos级别模型,这实际上是为整个行业打开了能力上限的想象空间。对国产模型公司而言,海外龙头不断抬升天花板,持续验证市场需求的存在:只要证明更强智能能够解决更复杂的商业问题,资本市场的投入意愿和下游客户的付费意愿都会被激活。此外,模型公司开始关注可信度该维度,有利于构建更健康的商业生态和用户信任基础。关注国产模型的后续催化:智谱GLM模型在Coding和长程任务上的性能持续升级以及最新商业化进展,MiniMax即将发布的M3系列模型和Hailuo模型。 产业趋势关注: 1)模型:阿里巴巴(MaaS服务的ARR增速)、腾讯(微信Agent落地)、智谱(GLM模型迭代)、Minimax(M3系列模型和Hailuo模型)等 2)算力及云设施:金山云、联想集团、壁仞科技等 风险提示:模型效果及迭代不及预期,模型商业化不及预期,竞争超预期等。 国盛海外:夏君/焦安东,对口销售