概述
这是一篇时效性年中更新,记录 2026 年 5-6 月 AI 编程工具市场的快速变化。它不是对 完整选型报告 的替代——完整报告包含趋势分析、六大趋势和全部工具横评。本文聚焦最近一个月发生的三件事:
- 现有工具能力升级:Claude Code Dynamic Workflows 落地两周、Copilot 切换 AI Credits 计费、Cursor Cloud Agent 持续迭代
- 新玩家改变格局:Google Antigravity 2.0 从 VS Code fork 重构成 Agent 编排平台,正式入场
- 定价战和企业影响:API token 计费全面铺开,企业成本压力从个案变成行业问题
如果你在 5 月读过选型报告,这篇更新告诉你什么变了、什么没变、下一步该做什么。
新能力(最近一个月)
Claude Code Dynamic Workflows:两周成熟度评估
Dynamic Workflows 在 v2.1.154(5 月 28 日)引入,是 Claude Code 春季最大的单一更新。到 6 月初,已有足够的生产数据做初步判断。
工作方式:告诉 Claude 你要完成什么工作流,它自动拆解任务、创建并调度后台 agent 并行执行。/workflows 命令查看所有运行状态。
两周社区反馈汇总:
- 大型重构场景验证通过:多文件迁移、批量测试修复、跨模块重命名——这些从"等 Claude 一个个处理"变成自动拆分并行
- 与 Auto mode 组合有效:Auto mode 解决了"频繁确认",Dynamic Workflows 解决了"单 agent 瓶颈"
- 实际并行上限:社区反馈在 10-20 个并行 agent 范围内稳定,超过 30 个后协调开销明显上升
判断:Dynamic Workflows 已经可用于生产,但需要控制并行规模。详细的实战指南见 Dynamic Workflows 实战,版本变化细节见 Claude Code 更新追踪。配合 Opus 4.8 成为默认模型和 fast mode 降价(2x 费率换 2.5x 速度),Claude Code 的定位正式从"终端 Agent"变为"可编排的软件工程环境"。
Cursor Cloud Agent & Dev Environments
Cursor 3 的 Agents Window 已经 GA,支持本地、worktree、远程 SSH、云端之间并行跑多个 agent。6 月没有重大版本更新,但 Cloud Agent 的稳定性在持续改善。
关键能力现状:
/worktree与/best-of-n支持隔离分支和多模型并行评估- Bugbot MCP support 让 PR 审查能接外部工具上下文
- Canvases 让 agent 产出交互式 artifact
判断:Cursor 仍然是编辑器内体验最强的工具,但 Dynamic Workflows 让 Claude Code 在多 Agent 并行场景追平了差距。详细对比见 Cursor vs Claude Code 对比。
Google Antigravity 2.0:新玩家正式入场
Google 在 I/O 2026(5 月 19 日)发布 Antigravity 2.0,这不是增量更新,而是完全重建:
- 去掉代码编辑器:从 VS Code fork 变成 agent 编排平台。开发者不写代码,而是指挥 agent 写
- 四个产品形态:Desktop App(多 Agent 编排)、CLI(替代 Gemini CLI)、SDK(自托管)、Managed Agents(API)
- 演示数据:93 个子 agent 并行,2.6B tokens,$1,000 API 成本,12 小时构建 OS 框架
- 内置 Chromium:agent 可以启动浏览器做视觉验证,这是目前其他工具不具备的能力
- 争议:2.0 自动更新移除了编辑器,破坏了用户工作流;上线 24 小时内发现 prompt injection 沙箱逃逸漏洞
判断:Antigravity 2.0 在多 Agent 并行和视觉验证上有独到优势,但推理天花板受限于 Gemini 3.5 Flash。对于新项目原型和 Android 开发,值得评估;对于大型已有代码库维护,Claude Code 的 Opus 4.8 推理深度仍然更强。
GitHub Copilot Agent mode:AI Credits 计费切换
6 月 1 日,Copilot 全面切换到 AI Credits 用量计费,替代了原来的 Premium Request Units。这是 6 月对开发者影响最大的单一变化。
核心变化:
- 所有 Copilot 计划基于 token 消耗的 AI Credits 计费
- Copilot code review 开始消耗 GitHub Actions minutes
- 新增用户级预算控制和 Copilot Max 升级路径
- 用户反馈:Ars Technica 报道,大量用户反映"不到一天就用完一个月额度",sticker shock 广泛
判断:Copilot 的 $10/月 Pro 仍是入门最低价,但 AI Credits 切换后实际可用量大幅缩水。重度用户需要评估是否加购或切换到其他工具。
新能力对比表
| 工具 | 最近变化 | 成熟度 | 适合谁 |
|---|---|---|---|
| Claude Code | Dynamic Workflows + Opus 4.8 + fast mode 降价 | 生产可用 | 后端、大型代码库、多 Agent 编排 |
| Cursor | Agents Window GA + Bugbot MCP + Canvases | 成熟 | 前端、全栈、编辑器优先 |
| Antigravity 2.0 | 全新重做,agent 编排 + 内置浏览器 | 早期(有安全问题) | Android 开发、新项目原型 |
| Copilot | AI Credits 计费 + Agent mode | 成熟但可用量缩水 | GitHub 团队、入门用户 |
| Devin Desktop | 2.0 + Devin 深度耦合 + Devin for Terminal + 更名 | 成熟 | 想在一个产品里串本地和云端 |
新玩家
Antigravity 2.0:与现有工具的根本差异
Antigravity 不是"又一个 AI IDE",而是一个agent 编排操作系统。它的核心论点是:开发者不应该逐行编辑代码,而应该指挥 agent 生产代码。
与其他工具的关键差异:
| 维度 | Antigravity 2.0 | Claude Code | Cursor | Copilot |
|---|---|---|---|---|
| 哲学 | 指挥 agent,不写代码 | 终端原生,增强现有工作流 | 编辑器内 AI 协作 | IDE 助手 |
| 模型 | Gemini 3.5 Flash | Opus 4.8 / Sonnet 4 | 多模型可选 | 多模型可选 |
| 代码编辑器 | 无(已移除) | 无(终端) | 完整 IDE | 依附于 IDE |
| 内置浏览器 | Chromium | 无 | 无 | 无 |
| 并行 Agent | 4-5 个稳定 | 10-20 个稳定 | Composer 并行 | Agent mode |
早期用户反馈:编辑器移除引发强烈反弹,Google 随后保留旧版 IDE 作为独立产品。推理能力在 agentic benchmarks 上表现好(MCP Atlas 83.6%),但 SWE-Bench 仍落后于 Opus 4.8。内置 Chromium 视觉验证是最大差异化能力。
对中国开发者的影响:Gemini 3.5 Flash 的 token 价格($1.50/$9.00 每 M tokens)约为 Claude Opus 的 1/3,成本敏感团队值得评估。但网络访问是硬门槛。
Codex CLI 更新
OpenAI Codex CLI(开源)GitHub stars 达到 87.2k,仍然是开源终端 Agent 中的头部项目。5-6 月没有重大架构更新,重点在稳定性和企业集成。Codex 的定位正在与 Claude Code 分化:简单明确的任务用 Codex,需要理解项目上下文的复杂任务用 Claude Code。
其他值得关注
- Gemini CLI 即将退役:Google 宣布 6 月 18 日起停止服务免费和 AI Pro/Ultra 用户,全面迁移到 Antigravity CLI。还在用 Gemini CLI 的团队需要立即规划迁移
- AWS Kiro:AWS 推出 Kiro 进入 AI IDE 市场,$20/月,但尚未形成足够差异化
新格局判断
控制面分化更新:四条路线的年中态势
5 月选型报告中提出的控制面分化(编辑器 / 终端 / 云端 / IDE 扩展)在过去一个月没有根本变化,但出现了两个值得关注的位移:
- 终端路线能力追平:Claude Code Dynamic Workflows 让终端 Agent 在多 Agent 并行能力上追平了 Cursor 的 Agents Window。终端路线不再是"简单但灵活",而是"灵活且强大"
- Agent 编排路线出现:Antigravity 2.0 开辟了"agent 编排平台"这条新路线——不依附于任何编辑器或终端,独立存在。它是否成立,取决于开发者是否接受"不写代码"的工作方式
当前格局:
| 路线 | 代表 | 核心优势 | 核心限制 |
|---|---|---|---|
| 编辑器 | Cursor, Devin Desktop | 最低迁移成本,最直觉的交互 | 深度终端操作不如 CLI 灵活 |
| 终端 | Claude Code, Aider | 最大控制力,CI/CD 友好 | 无 GUI 补全,学习曲线陡 |
| 云端 | Copilot Coding Agent, Codex | 异步委托,团队友好 | 灵活性受限,环境隔离 |
| Agent 编排 | Antigravity 2.0 | 多 Agent 并行,视觉验证 | 早期产品,安全性待验证 |
定价战:API token 计费的全面冲击
6 月,AI 编程工具定价经历了三波冲击:
| 事件 | 时间 | 影响 |
|---|---|---|
| Anthropic/OpenAI Enterprise 切 API 计费 | 4-5 月 | 企业成本可预测性丧失 |
| Copilot AI Credits 切换 | 6 月 1 日 | 原本最便宜的入口突然缩水 |
| Antigravity 定价推出 | 5 月 19 日 | $19.99 Pro 档,$100 Ultra,匹配市场 |
对开发者的影响:所有重度用户的实际月度成本都在上升。Simon Willison 公开的数据(Claude Code + Codex 月 API 等价 $2,180,订阅实际 $200)说明订阅制对个人仍是大幅补贴——但企业不再享受这种折扣。
成本控制策略详见 成本控制指南。
中国开发者注意事项
6 月的变化对中国开发者有三个方面的影响:
- Antigravity 进入:$19.99/月的 Pro 方案和 Gemini 3.5 Flash 的低成本有吸引力,但需要国际网络
- Gemini CLI 退役:使用 Gemini CLI 的团队需要在 6 月 18 日前迁移到 Antigravity CLI 或其他工具
- 国产工具进展:Trae、DeepSeek / Qwen Code 在成本和中文能力上仍然是独立选项。详见 国产工具对比
- Agent SDK 框架同样在快速迭代:OpenAI Agents SDK 已到 0.17.2、LangGraph 1.2.0 GA、Semantic Kernel 正式被 MAF 取代。详见 框架更新追踪
与一个月前相比:关键变化清单
| 工具 | 一个月前状态 | 当前状态 | 影响 |
|---|---|---|---|
| Claude Code | 单 agent 终端工具 | Dynamic Workflows 多 agent 编排 + Opus 4.8 默认 | 从终端 Agent 升级为编排引擎 |
| Cursor | Agents Window GA | 稳定迭代,无重大更新 | 维持编辑器路线领先地位 |
| Copilot | Premium Requests 计费 | AI Credits token 计费,可用量缩水 | 重度用户需要重新评估成本 |
| Antigravity | VS Code fork 的 Gemini Code Assist | 2.0 全新重做,agent 编排平台 | 正式成为第四条路线玩家 |
| Codex CLI | 开源终端 Agent | 稳定维护,87.2k stars | 定位分化为简单任务专用 |
| Devin Desktop | Windsurf 2.0 + Devin 耦合 → 6 月 2 日更名 | Devin for Terminal 持续增强,Devin Local 替代 Cascade | 本地-云端一体路线更清晰 |
行动建议
正在选工具
- 先按控制面选:编辑器选 Cursor,终端选 Claude Code,GitHub 工作流选 Copilot,Android/Google 生态选 Antigravity
- 不要同时订阅超过 2 个工具。推荐组合:Cursor(日常)+ Claude Code(深度任务),或 Copilot(入门)+ Claude Code(进阶)
- 详细选型流程看 完整选型报告
在用 Claude Code
- 必须升级到 v2.1.154+:Dynamic Workflows + Opus 4.8 + fast mode 降价是春季最大跨越
- 试用
/workflows做一次大型重构,感受多 Agent 编排的效果 - 关注
/usage按类别的成本拆分,找到你的成本热点
在用 Cursor
- 如果你经常需要批量操作或 CI/CD 集成,考虑加一个 Claude Code 作为互补。两者组合使用的方案已经成熟
- 关注 Bugbot MCP support,让 PR 审查接入外部工具上下文
在评估 Antigravity
- 先用 AI Plus 或 AI Pro 试一个月,不要直接上 $100 Ultra
- 你的项目是 Android 开发或 Google Cloud 生态 → 优先评估
- 你的项目是大型已有代码库维护 → Claude Code 或 Cursor 仍然更稳
- 注意 Gemini CLI 6 月 18 日退役,如果用 Gemini CLI 请立即规划迁移