横评:选型与取舍

AI 编程 Agent 2026 年中更新:新能力、新玩家、新格局

更新 原创整合
标签
ai-codingcomparisonclaude-codecursorupdates

概述

这是一篇时效性年中更新,记录 2026 年 5-6 月 AI 编程工具市场的快速变化。它不是对 完整选型报告 的替代——完整报告包含趋势分析、六大趋势和全部工具横评。本文聚焦最近一个月发生的三件事:

  1. 现有工具能力升级:Claude Code Dynamic Workflows 落地两周、Copilot 切换 AI Credits 计费、Cursor Cloud Agent 持续迭代
  2. 新玩家改变格局:Google Antigravity 2.0 从 VS Code fork 重构成 Agent 编排平台,正式入场
  3. 定价战和企业影响:API token 计费全面铺开,企业成本压力从个案变成行业问题

如果你在 5 月读过选型报告,这篇更新告诉你什么变了、什么没变、下一步该做什么。


新能力(最近一个月)

Claude Code Dynamic Workflows:两周成熟度评估

Dynamic Workflows 在 v2.1.154(5 月 28 日)引入,是 Claude Code 春季最大的单一更新。到 6 月初,已有足够的生产数据做初步判断。

工作方式:告诉 Claude 你要完成什么工作流,它自动拆解任务、创建并调度后台 agent 并行执行。/workflows 命令查看所有运行状态。

两周社区反馈汇总

  • 大型重构场景验证通过:多文件迁移、批量测试修复、跨模块重命名——这些从"等 Claude 一个个处理"变成自动拆分并行
  • 与 Auto mode 组合有效:Auto mode 解决了"频繁确认",Dynamic Workflows 解决了"单 agent 瓶颈"
  • 实际并行上限:社区反馈在 10-20 个并行 agent 范围内稳定,超过 30 个后协调开销明显上升

判断:Dynamic Workflows 已经可用于生产,但需要控制并行规模。详细的实战指南见 Dynamic Workflows 实战,版本变化细节见 Claude Code 更新追踪。配合 Opus 4.8 成为默认模型和 fast mode 降价(2x 费率换 2.5x 速度),Claude Code 的定位正式从"终端 Agent"变为"可编排的软件工程环境"。

Cursor Cloud Agent & Dev Environments

Cursor 3 的 Agents Window 已经 GA,支持本地、worktree、远程 SSH、云端之间并行跑多个 agent。6 月没有重大版本更新,但 Cloud Agent 的稳定性在持续改善。

关键能力现状:

  • /worktree/best-of-n 支持隔离分支和多模型并行评估
  • Bugbot MCP support 让 PR 审查能接外部工具上下文
  • Canvases 让 agent 产出交互式 artifact

判断:Cursor 仍然是编辑器内体验最强的工具,但 Dynamic Workflows 让 Claude Code 在多 Agent 并行场景追平了差距。详细对比见 Cursor vs Claude Code 对比

Google Antigravity 2.0:新玩家正式入场

Google 在 I/O 2026(5 月 19 日)发布 Antigravity 2.0,这不是增量更新,而是完全重建:

  • 去掉代码编辑器:从 VS Code fork 变成 agent 编排平台。开发者不写代码,而是指挥 agent 写
  • 四个产品形态:Desktop App(多 Agent 编排)、CLI(替代 Gemini CLI)、SDK(自托管)、Managed Agents(API)
  • 演示数据:93 个子 agent 并行,2.6B tokens,$1,000 API 成本,12 小时构建 OS 框架
  • 内置 Chromium:agent 可以启动浏览器做视觉验证,这是目前其他工具不具备的能力
  • 争议:2.0 自动更新移除了编辑器,破坏了用户工作流;上线 24 小时内发现 prompt injection 沙箱逃逸漏洞

判断:Antigravity 2.0 在多 Agent 并行和视觉验证上有独到优势,但推理天花板受限于 Gemini 3.5 Flash。对于新项目原型和 Android 开发,值得评估;对于大型已有代码库维护,Claude Code 的 Opus 4.8 推理深度仍然更强。

GitHub Copilot Agent mode:AI Credits 计费切换

6 月 1 日,Copilot 全面切换到 AI Credits 用量计费,替代了原来的 Premium Request Units。这是 6 月对开发者影响最大的单一变化。

核心变化:

  • 所有 Copilot 计划基于 token 消耗的 AI Credits 计费
  • Copilot code review 开始消耗 GitHub Actions minutes
  • 新增用户级预算控制和 Copilot Max 升级路径
  • 用户反馈:Ars Technica 报道,大量用户反映"不到一天就用完一个月额度",sticker shock 广泛

判断:Copilot 的 $10/月 Pro 仍是入门最低价,但 AI Credits 切换后实际可用量大幅缩水。重度用户需要评估是否加购或切换到其他工具。

新能力对比表

工具 最近变化 成熟度 适合谁
Claude Code Dynamic Workflows + Opus 4.8 + fast mode 降价 生产可用 后端、大型代码库、多 Agent 编排
Cursor Agents Window GA + Bugbot MCP + Canvases 成熟 前端、全栈、编辑器优先
Antigravity 2.0 全新重做,agent 编排 + 内置浏览器 早期(有安全问题) Android 开发、新项目原型
Copilot AI Credits 计费 + Agent mode 成熟但可用量缩水 GitHub 团队、入门用户
Devin Desktop 2.0 + Devin 深度耦合 + Devin for Terminal + 更名 成熟 想在一个产品里串本地和云端

新玩家

Antigravity 2.0:与现有工具的根本差异

Antigravity 不是"又一个 AI IDE",而是一个agent 编排操作系统。它的核心论点是:开发者不应该逐行编辑代码,而应该指挥 agent 生产代码。

与其他工具的关键差异

维度 Antigravity 2.0 Claude Code Cursor Copilot
哲学 指挥 agent,不写代码 终端原生,增强现有工作流 编辑器内 AI 协作 IDE 助手
模型 Gemini 3.5 Flash Opus 4.8 / Sonnet 4 多模型可选 多模型可选
代码编辑器 无(已移除) 无(终端) 完整 IDE 依附于 IDE
内置浏览器 Chromium
并行 Agent 4-5 个稳定 10-20 个稳定 Composer 并行 Agent mode

早期用户反馈:编辑器移除引发强烈反弹,Google 随后保留旧版 IDE 作为独立产品。推理能力在 agentic benchmarks 上表现好(MCP Atlas 83.6%),但 SWE-Bench 仍落后于 Opus 4.8。内置 Chromium 视觉验证是最大差异化能力。

对中国开发者的影响:Gemini 3.5 Flash 的 token 价格($1.50/$9.00 每 M tokens)约为 Claude Opus 的 1/3,成本敏感团队值得评估。但网络访问是硬门槛。

Codex CLI 更新

OpenAI Codex CLI(开源)GitHub stars 达到 87.2k,仍然是开源终端 Agent 中的头部项目。5-6 月没有重大架构更新,重点在稳定性和企业集成。Codex 的定位正在与 Claude Code 分化:简单明确的任务用 Codex,需要理解项目上下文的复杂任务用 Claude Code。

其他值得关注

  • Gemini CLI 即将退役:Google 宣布 6 月 18 日起停止服务免费和 AI Pro/Ultra 用户,全面迁移到 Antigravity CLI。还在用 Gemini CLI 的团队需要立即规划迁移
  • AWS Kiro:AWS 推出 Kiro 进入 AI IDE 市场,$20/月,但尚未形成足够差异化

新格局判断

控制面分化更新:四条路线的年中态势

5 月选型报告中提出的控制面分化(编辑器 / 终端 / 云端 / IDE 扩展)在过去一个月没有根本变化,但出现了两个值得关注的位移:

  1. 终端路线能力追平:Claude Code Dynamic Workflows 让终端 Agent 在多 Agent 并行能力上追平了 Cursor 的 Agents Window。终端路线不再是"简单但灵活",而是"灵活且强大"
  2. Agent 编排路线出现:Antigravity 2.0 开辟了"agent 编排平台"这条新路线——不依附于任何编辑器或终端,独立存在。它是否成立,取决于开发者是否接受"不写代码"的工作方式

当前格局

路线 代表 核心优势 核心限制
编辑器 Cursor, Devin Desktop 最低迁移成本,最直觉的交互 深度终端操作不如 CLI 灵活
终端 Claude Code, Aider 最大控制力,CI/CD 友好 无 GUI 补全,学习曲线陡
云端 Copilot Coding Agent, Codex 异步委托,团队友好 灵活性受限,环境隔离
Agent 编排 Antigravity 2.0 多 Agent 并行,视觉验证 早期产品,安全性待验证

定价战:API token 计费的全面冲击

6 月,AI 编程工具定价经历了三波冲击:

事件 时间 影响
Anthropic/OpenAI Enterprise 切 API 计费 4-5 月 企业成本可预测性丧失
Copilot AI Credits 切换 6 月 1 日 原本最便宜的入口突然缩水
Antigravity 定价推出 5 月 19 日 $19.99 Pro 档,$100 Ultra,匹配市场

对开发者的影响:所有重度用户的实际月度成本都在上升。Simon Willison 公开的数据(Claude Code + Codex 月 API 等价 $2,180,订阅实际 $200)说明订阅制对个人仍是大幅补贴——但企业不再享受这种折扣。

成本控制策略详见 成本控制指南

中国开发者注意事项

6 月的变化对中国开发者有三个方面的影响:

  1. Antigravity 进入:$19.99/月的 Pro 方案和 Gemini 3.5 Flash 的低成本有吸引力,但需要国际网络
  2. Gemini CLI 退役:使用 Gemini CLI 的团队需要在 6 月 18 日前迁移到 Antigravity CLI 或其他工具
  3. 国产工具进展:Trae、DeepSeek / Qwen Code 在成本和中文能力上仍然是独立选项。详见 国产工具对比
  4. Agent SDK 框架同样在快速迭代:OpenAI Agents SDK 已到 0.17.2、LangGraph 1.2.0 GA、Semantic Kernel 正式被 MAF 取代。详见 框架更新追踪

与一个月前相比:关键变化清单

工具 一个月前状态 当前状态 影响
Claude Code 单 agent 终端工具 Dynamic Workflows 多 agent 编排 + Opus 4.8 默认 从终端 Agent 升级为编排引擎
Cursor Agents Window GA 稳定迭代,无重大更新 维持编辑器路线领先地位
Copilot Premium Requests 计费 AI Credits token 计费,可用量缩水 重度用户需要重新评估成本
Antigravity VS Code fork 的 Gemini Code Assist 2.0 全新重做,agent 编排平台 正式成为第四条路线玩家
Codex CLI 开源终端 Agent 稳定维护,87.2k stars 定位分化为简单任务专用
Devin Desktop Windsurf 2.0 + Devin 耦合 → 6 月 2 日更名 Devin for Terminal 持续增强,Devin Local 替代 Cascade 本地-云端一体路线更清晰

行动建议

正在选工具

  • 先按控制面选:编辑器选 Cursor,终端选 Claude Code,GitHub 工作流选 Copilot,Android/Google 生态选 Antigravity
  • 不要同时订阅超过 2 个工具。推荐组合:Cursor(日常)+ Claude Code(深度任务),或 Copilot(入门)+ Claude Code(进阶)
  • 详细选型流程看 完整选型报告

在用 Claude Code

  • 必须升级到 v2.1.154+:Dynamic Workflows + Opus 4.8 + fast mode 降价是春季最大跨越
  • 试用 /workflows 做一次大型重构,感受多 Agent 编排的效果
  • 关注 /usage 按类别的成本拆分,找到你的成本热点

在用 Cursor

  • 如果你经常需要批量操作或 CI/CD 集成,考虑加一个 Claude Code 作为互补。两者组合使用的方案已经成熟
  • 关注 Bugbot MCP support,让 PR 审查接入外部工具上下文

在评估 Antigravity

  • 先用 AI Plus 或 AI Pro 试一个月,不要直接上 $100 Ultra
  • 你的项目是 Android 开发或 Google Cloud 生态 → 优先评估
  • 你的项目是大型已有代码库维护 → Claude Code 或 Cursor 仍然更稳
  • 注意 Gemini CLI 6 月 18 日退役,如果用 Gemini CLI 请立即规划迁移