AI 编程 Agent 2026 年中更新：新能力、新玩家、新格局

概述

这是一篇时效性年中更新，记录 2026 年 5-6 月 AI 编程工具市场的快速变化。它不是对完整选型报告的替代——完整报告包含趋势分析、六大趋势和全部工具横评。本文聚焦最近两个月发生的三件事：

Cursor 6 月爆发：Cloud Subagents（/in-cloud）、Automations（/automate）、Customize 统一管理、iOS 移动端——Cursor 在 6 月从编辑器工具变成了完整的 Agent 工作平台
Claude Code 持续密集迭代：Dynamic Workflows 之后，W24-W26（v2.1.166-193）又带来 /cd、嵌套子 Agent、Artifacts、claude mcp login、fallback model 等一系列更新
定价战和框架格局变化：Copilot AI Credits 计费冲击持续；Google ADK 2.0 正式 GA，OpenAI Agents SDK 到 0.17.7、LangGraph 到 1.2.7

如果你在 5 月读过选型报告，这篇更新告诉你什么变了、什么没变、下一步该做什么。

新能力（最近一个月）

Claude Code Dynamic Workflows：两周成熟度评估

Dynamic Workflows 在 v2.1.154（5 月 28 日）引入，是 Claude Code 春季最大的单一更新。到 6 月初，已有足够的生产数据做初步判断。

工作方式：告诉 Claude 你要完成什么工作流，它自动拆解任务、创建并调度后台 agent 并行执行。/workflows 命令查看所有运行状态。

两周社区反馈汇总：

大型重构场景验证通过：多文件迁移、批量测试修复、跨模块重命名——这些从"等 Claude 一个个处理"变成自动拆分并行
与 Auto mode 组合有效：Auto mode 解决了"频繁确认"，Dynamic Workflows 解决了"单 agent 瓶颈"
实际并行上限：社区反馈在 10-20 个并行 agent 范围内稳定，超过 30 个后协调开销明显上升

判断：Dynamic Workflows 已经可用于生产，但需要控制并行规模。详细的实战指南见 Dynamic Workflows 实战，版本变化细节见 Claude Code 更新追踪。配合 Opus 4.8 成为默认模型和 fast mode 降价（2x 费率换 2.5x 速度），Claude Code 的定位正式从"终端 Agent"变为"可编排的软件工程环境"。

6 月下旬持续迭代（W24-W26，v2.1.166-193）：Dynamic Workflows 之后 Claude Code 又密集发布三轮周更新，核心补强：

/cd（W24）：会话中途切换工作目录，不重建 prompt cache
嵌套子 Agent（W24）：sub-agent 可生成自己的 sub-agent，后台链路最多 5 层深
fallbackModel（W24）：配置最多 3 个备选模型，主模型不可用时按序降级
Artifacts（W25，beta）：把会话输出变成 claude.ai 上的实时可分享页面，随 session 持续更新
deny/ask 规则匹配工具参数（W25）：Tool(param:value) 语法，例如 Agent(model:opus) 精确控制
auto mode 拦截破坏性 git 操作（W25）：未要求丢弃本地改动时自动阻止
claude mcp login/logout（W26）：从 shell 直接认证 MCP 服务器，不必进 /mcp 交互菜单
/rewind（W26）：可以恢复到 /clear 之前的对话状态

Cursor：6 月全面爆发，从编辑器变成 Agent 工作平台

如果说 5 月的焦点是 Claude Code 的 Dynamic Workflows，那 6 月属于 Cursor。Cursor 在三周内连发 3.7→3.9，把编辑器工具彻底推进为完整的 Agent 工作平台：

3.7（6 月 17 日）— Cloud Subagents 和环境管理：

Cloud 环境快速搭建：Cursor 自动帮你装依赖、配环境，10 分钟内搭好云端开发环境并做成可复用快照（.cursor/environment.json）
/in-cloud：在独立 VM 里跑 cloud subagent，本地工作区不受影响。适合隔离长时间任务（修 CI、调查 issue、探索代码库）
/babysit：让 cloud agent 远程迭代把 PR 准备到可合并状态，不占本地会话
本地↔云端 handoff：可靠地在本地和云端之间移交 agent 会话，想跑多少个并行 cloud agent 都行

3.8（6 月 18 日）— Automations 自动化：

/automate：在本地 agent 会话里用自然语言创建自动化任务
Slack emoji 触发：对 Slack 消息加指定 emoji 即可触发 automation
5 个新 GitHub 触发器：issue 评论、PR review 评论、review 提交、review thread 更新、workflow run 完成
Computer use 工具：cloud agent 可以用自己的"电脑"生成 demo 或 artifact

3.9（6 月 22 日 + 6 月 29 日）— Customize 和移动端：

Customize 页面：plugins、skills、MCPs、subagents、rules、commands、hooks 统一在一个页面管理（user/team/workspace 三级）
Marketplace 排行榜：团队内最热门的 plugins/skills/MCPs 一目了然
Plugin canvases：预置共享模板（Hex 数据可视化、Atlassian 项目视图）
iOS 移动端（公测）：从手机启动和管理 always-on cloud agent，Remote Control 远程操控本地 agent，Live Activities 追踪状态

Bugbot 大升级（6 月 10 日）：Composer 2.5 驱动，审查速度从 ~5 分钟降到 ~90 秒（3x+），单次成本降 22%，发现 bug 数量提升 10%。新增 /review 在 push 前跑 Bugbot + Security Review。

关键能力现状：

/worktree 与 /best-of-n 支持隔离分支和多模型并行评估
Cloud subagents（/in-cloud）让本地与云端并行能力追平甚至超过 Claude Code 的 Dynamic Workflows
Automations 把 Slack/GitHub 事件直接接到 always-on cloud agent，不再只是"在编辑器里用 AI"

判断：6 月之前，Dynamic Workflows 让 Claude Code 在多 Agent 并行场景追平了 Cursor。6 月之后，Cursor 用 Cloud Subagents + Automations + 移动端重新拉开了差距——尤其在"团队协作"和"随时随地控制 agent"这两个维度。但 Cursor 的云端依赖更强，对网络和预算敏感的团队仍需权衡。详细对比见 Cursor vs Claude Code 对比。

Google Antigravity 2.0：新玩家正式入场

Google 在 I/O 2026（5 月 19 日）发布 Antigravity 2.0，这不是增量更新，而是完全重建：

去掉代码编辑器：从 VS Code fork 变成 agent 编排平台。开发者不写代码，而是指挥 agent 写
四个产品形态：Desktop App（多 Agent 编排）、CLI（替代 Gemini CLI）、SDK（自托管）、Managed Agents（API）
演示数据：93 个子 agent 并行，2.6B tokens，$1,000 API 成本，12 小时构建 OS 框架
内置 Chromium：agent 可以启动浏览器做视觉验证，这是目前其他工具不具备的能力
争议：2.0 自动更新移除了编辑器，破坏了用户工作流；上线 24 小时内发现 prompt injection 沙箱逃逸漏洞

判断：Antigravity 2.0 在多 Agent 并行和视觉验证上有独到优势，但推理天花板受限于 Gemini 3.5 Flash。对于新项目原型和 Android 开发，值得评估；对于大型已有代码库维护，Claude Code 的 Opus 4.8 推理深度仍然更强。

GitHub Copilot Agent mode：AI Credits 计费切换

6 月 1 日，Copilot 全面切换到 AI Credits 用量计费，替代了原来的 Premium Request Units。这是 6 月对开发者影响最大的单一变化。

核心变化：

所有 Copilot 计划基于 token 消耗的 AI Credits 计费
Copilot code review 开始消耗 GitHub Actions minutes
新增用户级预算控制和 Copilot Max 升级路径
用户反馈：Ars Technica 报道，大量用户反映"不到一天就用完一个月额度"，sticker shock 广泛

判断：Copilot 的 $10/月 Pro 仍是入门最低价，但 AI Credits 切换后实际可用量大幅缩水。重度用户需要评估是否加购或切换到其他工具。

新能力对比表

工具	最近变化	成熟度	适合谁
Claude Code	Dynamic Workflows + Opus 4.8 + W24-W26 持续密集迭代（`/cd`、嵌套子 Agent、Artifacts、fallback model）	生产可用	后端、大型代码库、多 Agent 编排
Cursor	6 月全面爆发：Cloud Subagents + Automations + Customize + iOS 移动端 + Bugbot 3x 提速	成熟且领先	前端、全栈、团队协作、移动办公
Antigravity 2.0	全新重做，agent 编排 + 内置浏览器	早期（有安全问题）	Android 开发、新项目原型
Copilot	AI Credits 计费 + Agent mode	成熟但可用量缩水	GitHub 团队、入门用户
Devin Desktop	2.0 + Devin 深度耦合 + Devin for Terminal + 更名	成熟	想在一个产品里串本地和云端

新玩家

Antigravity 2.0：与现有工具的根本差异

Antigravity 不是"又一个 AI IDE"，而是一个agent 编排操作系统。它的核心论点是：开发者不应该逐行编辑代码，而应该指挥 agent 生产代码。

与其他工具的关键差异：

维度	Antigravity 2.0	Claude Code	Cursor	Copilot
哲学	指挥 agent，不写代码	终端原生，增强现有工作流	编辑器内 AI 协作	IDE 助手
模型	Gemini 3.5 Flash	Opus 4.8 / Sonnet 4	多模型可选	多模型可选
代码编辑器	无（已移除）	无（终端）	完整 IDE	依附于 IDE
内置浏览器	Chromium	无	无	无
并行 Agent	4-5 个稳定	10-20 个稳定	Composer 并行	Agent mode

早期用户反馈：编辑器移除引发强烈反弹，Google 随后保留旧版 IDE 作为独立产品。推理能力在 agentic benchmarks 上表现好（MCP Atlas 83.6%），但 SWE-Bench 仍落后于 Opus 4.8。内置 Chromium 视觉验证是最大差异化能力。

对中国开发者的影响：Gemini 3.5 Flash 的 token 价格（$1.50/$9.00 每 M tokens）约为 Claude Opus 的 1/3，成本敏感团队值得评估。但网络访问是硬门槛。

Codex CLI 更新

OpenAI Codex CLI（开源）GitHub stars 达到 87.2k，仍然是开源终端 Agent 中的头部项目。5-6 月没有重大架构更新，重点在稳定性和企业集成。Codex 的定位正在与 Claude Code 分化：简单明确的任务用 Codex，需要理解项目上下文的复杂任务用 Claude Code。

其他值得关注

Gemini CLI 即将退役：Google 宣布 6 月 18 日起停止服务免费和 AI Pro/Ultra 用户，全面迁移到 Antigravity CLI。还在用 Gemini CLI 的团队需要立即规划迁移
AWS Kiro：AWS 推出 Kiro 进入 AI IDE 市场，$20/月，但尚未形成足够差异化

新格局判断

控制面分化更新：四条路线的年中态势

5 月选型报告中提出的控制面分化（编辑器 / 终端 / 云端 / IDE 扩展）在 6 月发生了重要位移：

编辑器路线重新领先：Cursor 的 Cloud Subagents（/in-cloud）+ Automations + 移动端，让编辑器工具不仅"在编辑器里用 AI"，还能从手机、Slack、GitHub 触发 always-on cloud agent。5 月 Claude Code 的 Dynamic Workflows 暂时追平了 Cursor，6 月 Cursor 全面拉开
终端路线持续密集迭代：Claude Code 在 W24-W26 又发布了嵌套子 Agent、Artifacts、fallback model、/cd 等一系列更新，保持每周迭代节奏
Agent 编排路线尚在验证：Antigravity 2.0 开辟的"agent 编排平台"路线仍处于早期，安全性待验证

当前格局：

路线	代表	核心优势	核心限制
编辑器	Cursor, Devin Desktop	最低迁移成本，最直觉的交互	深度终端操作不如 CLI 灵活
终端	Claude Code, Aider	最大控制力，CI/CD 友好	无 GUI 补全，学习曲线陡
云端	Copilot Coding Agent, Codex	异步委托，团队友好	灵活性受限，环境隔离
Agent 编排	Antigravity 2.0	多 Agent 并行，视觉验证	早期产品，安全性待验证

定价战：API token 计费的全面冲击

6 月，AI 编程工具定价经历了三波冲击：

事件	时间	影响
Anthropic/OpenAI Enterprise 切 API 计费	4-5 月	企业成本可预测性丧失
Copilot AI Credits 切换	6 月 1 日	原本最便宜的入口突然缩水
Antigravity 定价推出	5 月 19 日	$19.99 Pro 档，$100 Ultra，匹配市场

对开发者的影响：所有重度用户的实际月度成本都在上升。Simon Willison 公开的数据（Claude Code + Codex 月 API 等价 $2,180，订阅实际 $200）说明订阅制对个人仍是大幅补贴——但企业不再享受这种折扣。

成本控制策略详见成本控制指南。

中国开发者注意事项

6 月的变化对中国开发者有三个方面的影响：

Antigravity 进入：$19.99/月的 Pro 方案和 Gemini 3.5 Flash 的低成本有吸引力，但需要国际网络
Gemini CLI 退役：使用 Gemini CLI 的团队需要在 6 月 18 日前迁移到 Antigravity CLI 或其他工具
国产工具进展：Trae、DeepSeek / Qwen Code 在成本和中文能力上仍然是独立选项。详见国产工具对比
Agent SDK 框架同样在快速迭代：OpenAI Agents SDK 已到 0.17.7、LangGraph 1.2.7、Google ADK 2.2.0 正式 GA、Semantic Kernel 正式被 MAF 取代。详见框架更新追踪

与两个月前相比：关键变化清单

工具	5 月初状态	6 月底状态	影响
Claude Code	单 agent 终端工具	Dynamic Workflows + Opus 4.8 + W24-W26 持续迭代（嵌套子 Agent、Artifacts、fallback model）	从终端 Agent 升级为编排引擎，迭代密度行业最高
Cursor	编辑器内最强体验	6 月全面爆发：Cloud Subagents + Automations + Customize + iOS + Bugbot 3x 提速	重新拉开与终端工具的差距，团队协作和移动办公维度领先
Copilot	Premium Requests 计费	AI Credits token 计费，可用量缩水，Max $100/月	重度用户需要重新评估成本
Antigravity	VS Code fork 的 Gemini Code Assist	2.0 全新重做，agent 编排平台	正式成为第四条路线玩家
Google ADK	1.33.0 + 2.0 beta	2.0 GA → 2.2.0，生产级多 Agent 编排框架	Google Cloud 生态默认选择正式确定
Codex CLI	开源终端 Agent	稳定维护，87.2k stars	定位分化为简单任务专用
Devin Desktop	Windsurf 2.0 + Devin 耦合 → 6 月 2 日更名	Devin for Terminal 持续增强，Devin Local 替代 Cascade	本地-云端一体路线更清晰

行动建议

正在选工具

先按控制面选：编辑器选 Cursor，终端选 Claude Code，GitHub 工作流选 Copilot，Android/Google 生态选 Antigravity
不要同时订阅超过 2 个工具。推荐组合：Cursor（日常）+ Claude Code（深度任务），或 Copilot（入门）+ Claude Code（进阶）
详细选型流程看完整选型报告

在用 Claude Code

必须升级到 v2.1.176+：W24-W26 的更新（嵌套子 Agent、/cd、Artifacts、fallback model）进一步强化编排能力
试用 /cd 在多仓库项目间无缝切换工作目录
配置 fallbackModel 避免单一模型不可用时中断
关注 /usage 按类别的成本拆分，找到你的成本热点

在用 Cursor

升级到 3.9+：Cloud Subagents + Automations + Customize 是 6 月最重要的三组更新
试用 /in-cloud 把长时间任务隔离到云端 VM，保持本地工作区干净
用 /automate 把重复性 GitHub/Slack 任务接入 always-on cloud agent
如果有团队，在 Customize 页面统一管理 plugins/skills/MCPs，用 Marketplace 排行榜发现团队最佳实践
Bugbot 已 3x 提速 + Composer 2.5 驱动，用 /review 在 push 前跑审查

在评估 Antigravity

先用 AI Plus 或 AI Pro 试一个月，不要直接上 $100 Ultra
你的项目是 Android 开发或 Google Cloud 生态 → 优先评估
你的项目是大型已有代码库维护 → Claude Code 或 Cursor 仍然更稳
注意 Gemini CLI 6 月 18 日退役，如果用 Gemini CLI 请立即规划迁移