Google I/O 2026：Gemini 3.5 Flash 与 Antigravity 标志 Google 正式转向 Agent 平台

概述

Google I/O 2026 最值得开发者关注的，不只是一个新模型发布，而是 Google 把模型、编程 Agent、个人 Agent 和开发者 API 组合成了一套更完整的 Agent 平台。

这次核心信号有四个：

Gemini 3.5 Flash 直接 GA，没有走 preview 阶段
Antigravity 成为 Google 进入 AI coding agent 市场的主品牌
Gemini Spark 把个人 Agent 接进 Gmail、Calendar、Drive、Docs、Sheets、Slides、YouTube 和 Google Maps
Gemini CLI 向 Antigravity CLI 迁移，而且从开源 TypeScript 工具转向闭源 Go 工具

对实践者来说，重点不是“Google 又发了一个模型”，而是：Google 正在从模型供应商变成 Agent 平台供应商。 这意味着未来选型时不能只比较模型分数，还要比较运行时、权限系统、数据接入、IDE、CLI、SDK 和安全边界。

Gemini 3.5 Flash：更强，但也更贵

Gemini 3.5 Flash 在 2026 年 5 月 20 日 Google I/O 上发布，一个非常不寻常的点是：它没有先进入 preview，而是直接进入 GA（General Availability）。模型 ID 是：

gemini-3.5-flash

主要规格如下：

项目	Gemini 3.5 Flash
输入上下文	1,048,576 tokens
最大输出	65,536 tokens
知识截止	2025 年 1 月
Computer use	暂未支持
输入价格	$1.50 / M tokens
输出价格	$9 / M tokens

这些数字说明它不是一个“小模型补位”。1M 级上下文和 65K 输出上限，使它可以处理长代码库、长文档、多轮任务轨迹和复杂报告生成。Simon Willison 也测试了它的 SVG 生成能力，其中包括经典的“鹈鹕骑自行车”测试，用来观察模型是否能把空间关系、对象组合和 SVG 语法同时处理好。

但这次真正需要注意的是价格。Gemini 3.5 Flash 的价格是 Gemini 3 Flash Preview 的 3 倍，也是 Gemini 3.1 Flash-Lite 的 6 倍。更直观的数字是：跑一轮 benchmark 的成本达到 $1,551.60，甚至高于 Gemini 3.1 Pro Preview 的 $892.28。

这不是 Google 一家的现象。2026 年主要模型厂商都在把旗舰或准旗舰模型往更高价格带推：GPT-5.5 是 GPT-5.4 的 2 倍，Claude Opus 4.7 是 4.6 的 1.46 倍。过去一年很多团队形成了一个默认假设：模型会越来越便宜。但 Gemini 3.5 Flash 提醒我们，能力提升并不自动等于单位任务成本下降。

实践影响很直接：如果你在做高频 Agent、代码审查、长上下文检索或批量内容生成，不能只看模型名字里的 Flash。需要重新计算每个任务的输入输出 token 分布、失败重试率和缓存命中率。Gemini 3.5 Flash 可能更适合高价值复杂任务，而不是无脑替换所有低成本调用。

Antigravity：Google 的 AI Coding Agent 入口

Antigravity 是这次 I/O 的第二个关键信号。官网是 antigravity.google，定位不是单一工具，而是一组围绕 AI coding agent 的产品和开发组件。

目前可以看到的组成包括：

组件	说明
Desktop app	面向终端用户的桌面应用
CLI agent tool	用 Go 编写的命令行 Agent 工具，闭源
Antigravity SDK	开源 Python wrapper，底层封装随包分发的闭源 Go binary
Antigravity IDE	VS Code fork，用于 Agent 驱动的开发体验

这套组合非常像 Google 对 Claude Code、Codex CLI、Cursor、OpenClaw 等产品方向的系统性回应。只发一个模型不够，因为 coding agent 的竞争已经不只是“模型能不能写代码”，而是“能不能持续理解项目、编辑文件、运行命令、处理错误、记住上下文、和 IDE/CLI 工作流融合”。

Antigravity SDK 的形式也很值得注意。它在 GitHub 上以 google-antigravity/antigravity-sdk-python 的形式出现，看起来是开源 Python 包，但核心能力依赖随包捆绑的闭源 Go binary。这种设计的好处是 Google 可以控制核心执行逻辑、快速更新跨平台二进制，同时给 Python 开发者一个熟悉的接入层。代价也明显：开发者能审计的边界变窄，社区很难像维护纯开源工具那样深入改造核心行为。

实践影响：如果你只是个人使用，Antigravity 可能会成为一个强力 coding agent 入口；如果你是企业平台团队，则要重点评估闭源二进制的权限、联网行为、日志策略、可观测性和供应链风险。AI coding agent 的真正风险不是“生成一段错代码”，而是它具备读写代码库、执行命令和访问凭证的能力。

Gemini Spark：个人 Agent 开始进入 Google 数据腹地

Gemini Spark 是 Google 对“personal AI agent”的新包装，可以理解为 Google 版 OpenClaw 竞争者。它运行在 Gemini 3.5 Flash 和 Antigravity 之上，但关键优势不是模型本身，而是原生连接 Google 生态数据。

Spark 可以直接连接：

Gmail
Calendar
Drive
Docs
Sheets
Slides
YouTube
Google Maps

这使它和普通第三方 Agent 处在完全不同的位置。第三方 Agent 通常要通过 OAuth、API 限额和各种权限弹窗接入数据；Google 自家的 Agent 则天然贴近用户最敏感、最连续、最结构化的个人与办公信息。

Google 对安全运行时给出了比较完整的描述：Gemini Spark 运行在 Google Cloud 上“fully managed, secure runtime”中；每个任务都在全新、隔离、临时的 VM 里执行；流量通过带有 DLP 策略的 “Agent Gateway”；用户凭据完全加密，不会暴露给 Agent。

这些设计说明 Google 知道个人 Agent 最大的阻力不是能力，而是信任。一个能读 Gmail、Calendar 和 Drive 的 Agent，如果权限边界不清楚，就是高价值攻击目标。Simon Willison 对此提出的核心担忧是 prompt injection：当 Agent 同时接触外部内容和敏感私有数据时，恶意邮件、文档、网页或评论可能通过自然语言诱导 Agent 泄露、转发或误用数据。

实践影响：企业和高级用户不应只问“Spark 能帮我做什么”，还要问“它在什么情况下不应该做什么”。对于接入邮箱、文档和日程的 Agent，权限最小化、任务级确认、外部内容隔离、审计日志和 DLP 策略会比模型分数更重要。

Gemini CLI → Antigravity CLI：开源到闭源的战略转向

这次最有争议的变化，是 Google 宣布 “Transitioning Gemini CLI to Antigravity CLI”。原本的 Gemini CLI 是 Apache 2.0 许可的开源 TypeScript 项目，但从 2026 年 6 月 18 日起，它将停止支持 AI subscription plans，接替者是闭源的 Antigravity CLI。

这件事对开发者社区的信号非常强：Google 不再把核心 coding agent 入口放在一个完全开源的 CLI 里，而是把它纳入 Antigravity 平台。换句话说，CLI 不只是一个调用模型的薄壳，而是平台控制点。

为什么 CLI 这么重要？因为 coding agent 的 CLI 通常掌握几类关键能力：

读取和修改本地文件
调用 shell 命令
管理任务历史和上下文
接入 IDE 或远程运行时
处理认证、订阅和组织策略

如果 CLI 是开源的，社区可以审计权限、扩展行为、fork 出替代版本；如果 CLI 是闭源的，厂商可以更一致地控制体验、安全策略和商业化路径，但用户也必须接受更大的黑盒。

实践影响：个人开发者可能只感受到“工具换名”；但企业、开源项目维护者和安全团队需要重新评估依赖边界。尤其是已经把 Gemini CLI 写进自动化流程的团队，应在 2026 年 6 月 18 日前完成迁移评估：哪些调用会失效，哪些权限需要重新授权，是否需要保留开源替代方案作为 fallback。

Interactions API：Google 版 Responses 模式

Gemini 3.5 Flash 同时带来了仍处于 beta 阶段的 Interactions API。它可以理解为 Google 对 OpenAI Responses pattern 的回应：把多轮交互、工具调用和历史状态的一部分管理放到服务端。

传统 Chat Completions 风格的接口，通常要求客户端自己维护完整消息历史。这样做透明、可控，但在长任务、Agent 轨迹和工具调用越来越复杂之后，客户端负担会迅速上升。Responses / Interactions 这类模式则把“交互对象”变成一等概念，让服务端保存更多上下文和中间状态。

这对 Agent 开发有两个潜在好处：

开发复杂度下降：客户端不必每次都拼完整历史。
平台优化空间变大：服务端可以做缓存、压缩、状态恢复和工具编排。

但它也带来新的取舍：历史由谁保存、保存多久、如何导出、如何审计、如何跨供应商迁移？当状态管理从应用侧转到平台侧，开发者得到便利，也增加了平台锁定。

实践影响：Interactions API 适合新 Agent 项目试用，尤其是需要长任务和服务端状态的场景。但如果你在构建多模型、多云或强合规系统，需要提前设计状态导出和回放机制，避免把核心任务轨迹锁死在单一供应商接口里。

对开发者和团队的影响

把 Gemini 3.5 Flash、Antigravity、Gemini Spark、Antigravity CLI 和 Interactions API 放在一起看，Google 的路线已经很清晰：

模型能力 → Agent 工具 → 托管运行时 → 数据连接 → 平台控制面

这会改变不同角色的决策方式。

角色	需要关注什么
应用开发者	Gemini 3.5 Flash 的成本、上下文能力和 Interactions API
AI coding 用户	Antigravity IDE / CLI 是否能替代现有 Claude Code、Codex、Cursor 工作流
企业平台团队	闭源 CLI、SDK 二进制、权限边界、审计和数据驻留
安全团队	Prompt injection、DLP、凭据隔离和 Agent Gateway 策略
开源维护者	Gemini CLI 迁移对自动化脚本和社区工具链的影响

Google 的独特优势在于数据入口。Anthropic 有 Claude Code 和 Claude Desktop，OpenAI 有 Codex 和 ChatGPT，但 Google 拥有 Gmail、Calendar、Drive、Docs、Sheets、Slides、YouTube 和 Maps 这些高频生产力数据。Agent 如果不能访问真实上下文，能力会被限制在“帮你写一段文本”；一旦能访问这些数据，它就可能变成真正的工作流执行者。

实践影响：未来评估 Agent 平台，不能只问“哪个模型更聪明”。更重要的问题是：它能访问哪些数据？权限能否精细控制？运行时是否隔离？任务过程是否可审计？迁移成本有多高？这些问题会直接决定 Agent 能不能进生产环境。

趋势判断

Google I/O 2026 的这组发布，标志着 AI 行业的竞争正在从“模型 API 竞争”进入“Agent 平台竞争”。三条主线已经形成：

Anthropic：Claude Code + Claude Desktop
OpenAI：Codex + ChatGPT
Google：Antigravity + Gemini Spark

Google 的打法最值得警惕，也最有潜力。它一边用 Gemini 3.5 Flash 提供长上下文和强模型能力，一边用 Antigravity 接管开发者工作流，再用 Gemini Spark 进入个人数据和办公数据场景。最后，通过 Interactions API 和闭源 CLI，把任务历史、运行时和平台策略进一步收拢到 Google 体系内。

这不一定是坏事。托管运行时、临时 VM、Agent Gateway、DLP 和加密凭据，确实是把 Agent 推向生产环境所需要的基础设施。但开源 Gemini CLI 转向闭源 Antigravity CLI，也说明厂商正在把 Agent 入口视为战略资产，而不是单纯的开发者示例项目。

我的判断是：2026 年下半年，Agent 平台的护城河会从模型能力转向数据权限、执行环境和工作流入口。 对开发者来说，最务实的策略不是押注某一家，而是把任务状态、权限模型和工具接口设计得足够清晰，保留迁移空间。谁能在能力、成本、安全和可控性之间取得平衡，谁才更适合进入长期生产系统。