- +1
Claude Opus 4.8深夜炸场,判断力大突破,梭哈Agent定了
Agent 不一样,它要读上下文、拆任务、写计划、调用工具、执行代码、检查结果、修复错误,有时还要拉起多个 subagents 并行工作。Claude Code 的 dynamic workflows 就是典型例子,官方自己也提醒它 powerful but expensive,会快速消耗大量 tokens。
所以,token 价格战不只是为了让聊天更便宜,而是为了让 Agent 这种高消耗形态跑得起来。所以,就连 Anthropic 也不得不把 fast mode 的价格打到了前代的三分之一,来应对这样的高消耗。
(图源:Anthropic)
看起来,大家只是在按部就班更新模型,但似乎都遗漏了一点,那就是这些模型的核心已经不再是聊天,而是比谁更能进入真实工作流。
过去的大模型竞争,主战场是对话,谁回答得更自然,谁推理更强,谁上下文更长,谁多模态更好,现在主战场正在变成 agent。
Agent 竞争的核心不是单次回答,而是连续执行,它要求模型会拆任务、会调用工具、会管理上下文、会处理权限、会控制成本、会复核输出,还要能在复杂环境中长时间不跑偏。
这也是为什么 Opus 4.8 的官方没有强调对话能力,而是把重点放在 agentic coding、computer use、knowledge work、financial analysis。因为 Anthropic 很清楚,未来最值钱的模型调用,不一定发生在聊天窗口里,而是发生在 IDE、终端、浏览器、数据平台、企业后台和各种自动化流程里。
(图源:Anthropic)
从这个角度看,dynamic workflows 可能比 Opus 4.8 本身更重要。因为它把 Claude Code 从“一个 AI 程序员”推向“一支 AI 工程队”。过去你让模型做任务,本质上是一个模型在一个上下文里循环。现在它开始能拆分任务、并行分配子代理、让不同 agent 互相验证,最后再汇总结果。
综合来看,5 月这场模型大混战,不只是“模型更强了”,而是“模型正在被允许做更多事”。
Claude 一夜蜕变成工作流系统
Opus 4.8 虽然在定位上是 Cludue 的旗舰模型,但不会是一次“震撼全场”的模型发布。
它更像 Anthropic 给市场递出的一张路线图,这张路线图里,模型不能只追求更聪明,还要更稳;任务不能只完成一轮对话,还要能持续推进;AI 不能只给出答案,还要能解释过程、复核结果、控制成本,并且把工作流沉淀下来。这些都是未来所有大模型都要关注的点。
于是我们可以看到,Opus 4.8 负责把 Claude 的判断力和长程执行能力往前推一步,effort control 让用户可以在质量、速度和成本之间主动调节,dynamic workflows 则把 Claude Code 从单个 coding agent,推向一个可以拆任务、调度 subagents、并行执行和复核结果的工程协作系统。
Claude 正在变成什么呢?答案已经很明显了,Claude 正在从一个聊天模型,变成一个工程协作系统。
接下来,大模型公司的竞争也会越来越少停留在“谁更会说”,而是把目标放在更可靠地完成复杂任务、更便宜地支撑高频调用,把模型、工具、工作流、安全和成本控制,真正打包成生产力系统。
在这一方向上, Anthropic 已经交出了第一份答卷。
Opus名字来自拉丁语中的“作品”,常用来形容一位作曲家的传世之作(magnum opus,即“最伟大的作品”)。在古典音乐里,Opus 后面跟着编号,代表作曲家最重要的创作。贝多芬的《月光奏鸣曲》是 Op. 27,《命运交响曲》是 Op. 67。这不是随便写的东西,这是呕心沥血的集大成之作。
从引领加速AI产业进入工作流时代的意义来看,Claude Opus 4.8确实堪称一个传世之作。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




