下载客户端

Claude Opus 4.8深夜炸场，判断力大突破，梭哈Agent定了

2026-05-29 15:25

来源：澎湃新闻·澎湃号·湃客

听全文

Agent 不一样，它要读上下文、拆任务、写计划、调用工具、执行代码、检查结果、修复错误，有时还要拉起多个 subagents 并行工作。Claude Code 的 dynamic workflows 就是典型例子，官方自己也提醒它 powerful but expensive，会快速消耗大量 tokens。

所以，token 价格战不只是为了让聊天更便宜，而是为了让 Agent 这种高消耗形态跑得起来。所以，就连 Anthropic 也不得不把 fast mode 的价格打到了前代的三分之一，来应对这样的高消耗。

（图源：Anthropic）

看起来，大家只是在按部就班更新模型，但似乎都遗漏了一点，那就是这些模型的核心已经不再是聊天，而是比谁更能进入真实工作流。

过去的大模型竞争，主战场是对话，谁回答得更自然，谁推理更强，谁上下文更长，谁多模态更好，现在主战场正在变成 agent。

Agent 竞争的核心不是单次回答，而是连续执行，它要求模型会拆任务、会调用工具、会管理上下文、会处理权限、会控制成本、会复核输出，还要能在复杂环境中长时间不跑偏。

这也是为什么 Opus 4.8 的官方没有强调对话能力，而是把重点放在 agentic coding、computer use、knowledge work、financial analysis。因为 Anthropic 很清楚，未来最值钱的模型调用，不一定发生在聊天窗口里，而是发生在 IDE、终端、浏览器、数据平台、企业后台和各种自动化流程里。

（图源：Anthropic）

从这个角度看，dynamic workflows 可能比 Opus 4.8 本身更重要。因为它把 Claude Code 从“一个 AI 程序员”推向“一支 AI 工程队”。过去你让模型做任务，本质上是一个模型在一个上下文里循环。现在它开始能拆分任务、并行分配子代理、让不同 agent 互相验证，最后再汇总结果。

综合来看，5 月这场模型大混战，不只是“模型更强了”，而是“模型正在被允许做更多事”。

Claude 一夜蜕变成工作流系统

Opus 4.8 虽然在定位上是 Cludue 的旗舰模型，但不会是一次“震撼全场”的模型发布。

它更像 Anthropic 给市场递出的一张路线图，这张路线图里，模型不能只追求更聪明，还要更稳；任务不能只完成一轮对话，还要能持续推进；AI 不能只给出答案，还要能解释过程、复核结果、控制成本，并且把工作流沉淀下来。这些都是未来所有大模型都要关注的点。

于是我们可以看到，Opus 4.8 负责把 Claude 的判断力和长程执行能力往前推一步，effort control 让用户可以在质量、速度和成本之间主动调节，dynamic workflows 则把 Claude Code 从单个 coding agent，推向一个可以拆任务、调度 subagents、并行执行和复核结果的工程协作系统。

Claude 正在变成什么呢？答案已经很明显了，Claude 正在从一个聊天模型，变成一个工程协作系统。

接下来，大模型公司的竞争也会越来越少停留在“谁更会说”，而是把目标放在更可靠地完成复杂任务、更便宜地支撑高频调用，把模型、工具、工作流、安全和成本控制，真正打包成生产力系统。

在这一方向上， Anthropic 已经交出了第一份答卷。

Opus名字来自拉丁语中的“作品”，常用来形容一位作曲家的传世之作（magnum opus，即“最伟大的作品”）。在古典音乐里，Opus 后面跟着编号，代表作曲家最重要的创作。贝多芬的《月光奏鸣曲》是 Op. 27，《命运交响曲》是 Op. 67。这不是随便写的东西，这是呕心沥血的集大成之作。

从引领加速AI产业进入工作流时代的意义来看，Claude Opus 4.8确实堪称一个传世之作。

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报

#Claude Opus #Claude #Opus #智能体