动态

AI Agent 一手资料与动态

官方文档、release、协议变化和生态更新。快速知道最近发生了什么、是否需要行动。

16 篇 · 最后更新:2026-07-01

行业与商业
动态:一手资料追踪 4 分钟

Simon Willison:Anthropic 和 OpenAI 找到了产品市场匹配

Simon Willison 在 5 月 27 日发了一篇长文,核心论点是:Anthropic 和 OpenAI 通过 Claude Code / Codex 这类编程 Agent 产品,终于找到了真正能赚钱的产品市场匹配。 这不是关于模型能力提升的判断,而是关于商业模式的判断。

  • Uber:CTO 表示 2026 年才过了几个月就用完全年 AI 预算,主要是 Claude Code。Simon 的解读:2025 年底做的预算,怎么可能预测到 Claude Code 在 2026 年的真实使用量?
  • Microsoft:开始取消工程师的 Claude Code 许可,要求他们用自家的 Copilot。The Verge 报道这背后也是财务考量。
安全
动态:一手资料追踪 3 分钟

Microsoft Copilot Cowork 数据泄露:Agent 安全的又一个"致命三要素"案例

2026 年 5 月,安全研究团队 PromptArmor 披露了 Microsoft Copilot Cowork 中的一个数据泄露漏洞。攻击路径简洁但有效:prompt injection → Agent 发邮件到用户邮箱 → 邮件渲染外部图片 → OneDrive 预认证链接泄露 → 文件被攻击者下载。

  • Agent 不应该在未审批的情况下发邮件——尤其是在邮件可以包含外部资源的场景
  • OneDrive 预认证链接不应该由 Agent 生成——除非有明确的访问控制
  • 邮件渲染不应该自动请求外部图片——这是 Email 安全的老问题,但 Agent 场景下风险被放大
动态:一手资料追踪 9 分钟

Anthropic 沙箱架构深度解读:从 gVisor 到 Seatbelt,Agent 安全的四层防线

2026 年 5 月 25 日,Anthropic 发布了工程博客 How we contain Claude across products,系统公开了 claude.ai、Claude Code、Claude Cowork 三条产品线的沙箱架构和安全事件。Simon Willison 评价这是"fantastic overview"——因为沙箱产品极少被如此详细地文档化。

  • claude.ai:临时文件系统,会话结束后销毁
  • Claude Code:允许读全盘,写限制在工作区(workspace)内
  • Cowork:只挂载用户选择的工作区文件夹和 .claude 目录,其余对 Agent 不可见。支持三种挂载模式:只读、读写、读写不可删
  • 沙箱边界可审计——你不需要信任 Anthropic 的二进制,可以自己读代码
观点与趋势
动态:一手资料追踪 4 分钟

SQLite 发布 AGENTS.md 明确拒绝 AI 生成代码:开源项目正在划定 AI 边界

2026 年 5 月 22 日,SQLite 在 GitHub 仓库中新增了一个 AGENTS.md 文件。这个文件不是给 SQLite 自己的开发用的,而是给"把 Agent 指向 SQLite 代码库"的人看的。

  • 不接受 Agent 生成的代码——明确拒绝,不是"暂不"
  • 接受 Agent 辅助的 bug 报告——但必须包含可复现的测试用例
  • 可以提交 Agent 生成的 patch 作为 proof-of-concept——但仅作参考,团队会自己重写
  • 每个报告都需要人验证
工具与框架
动态:一手资料追踪 11 分钟

Claude Code 2026 年春季更新摘要

如果只看 2026 年春季的 Claude Code 更新,趋势经历了两个阶段。W13-W21:从"终端 AI"变成"软件工程环境"——Auto mode、Computer use、Ultraplan、pinned sessions,一条线把默认工作流推向更少确认、更强执行、成本可观测。W23-W24:从"单 agent"变成"多 agent 编排"——Dynamic Workflows 让 Claude 自己拆分任务、创建并调度数十到数百个后台 agent 并行工作。

  • 更少打断:Auto mode 从 RP 到取消 opt-in 到扩展到 Bedrock/Vertex/Foundry
  • 更强执行:Computer use、/goal、/loop、Monitor、pinned sessions
  • 多 agent 编排:Dynamic Workflows、Opus 4.8、fast mode 降价
  • 更强云端协作:Ultraplan、Routines、/ultrareview、PR auto-fix、per-MCP cost
动态:一手资料追踪 7 分钟

为什么 Claude Code Dynamic Workflows 重新定义了终端优先的 Agent 开发

2026 年 5 月 28 日,Claude Code v2.1.154 发布。表面上看是一个常规版本更新,但引入的 Dynamic Workflows 让 Claude Code 完成了一个本质跨越:

  • 改一个文件:30 秒
  • 改十个相关文件:5 分钟
  • 做一次全库重构:可能要等 30 分钟,而且中间任何一个步骤出错都可能中断
  • Devin:你给目标,它自己做所有决策,你只在关键节点介入
动态:一手资料追踪 14 分钟

Agent 框架 2026 更新追踪

2026 年上半年的 Agent 框架生态出现三个重大变化:(1)OpenAI Agents SDK 爆发式增长,Python 端半年内从 0.1.0 迭代到 0.17.7(6 月 24 日),以每周 1-3 个版本的速度迭代;(2)LangGraph 进入 1.2.x 稳定双周更新,最新到 1.2.7(6 月 30 日);(3)Semantic Kernel 宣布被 Microsoft Agent Framework(MAF)取代。

  • v0.11.0:RealtimeAgent 默认使用 gpt-realtime-2,sandbox materialization 作为安全边界
  • v0.11.2-v0.11.4:sandbox、tracing、realtime、sessions 模块的大批量 bug 修复
  • 每周发布,与 Python SDK 保持功能对齐
  • 持久化执行:失败自动恢复,长时间运行的工作流开箱即用
协议与标准
动态:一手资料追踪 7 分钟

MCP 协议 2026 更新追踪:从能用走向可规模化

如果说 2025 年的 MCP 重点是“把协议做出来”,那么 2026 年的重点就是“把协议做成可规模化、可治理、可企业部署的基础设施”。过去几个月,MCP 的重点已经不再只是 Tools / Resources / Prompts 这些基础原语,而是围绕四个问题收敛:

  • 远程传输怎么在负载均衡、代理和多实例环境里稳定运行
  • 任务与会话怎么在生产环境里恢复、迁移和过期
  • 协议治理怎么从“核心维护者主导”走向 Working Group 常态化
  • 企业到底怎么做审计、SSO、代理层授权和配置移植
动态:一手资料追踪 10 分钟

MCP 协议生态 2026 上半年全览:协议进展、工具链与落地指南

2026 上半年的 MCP 生态完成了一个关键跃迁:从"能用"到"可以规模化部署"。 公共注册表记录的服务器数量从 2025 年底的 ~6,800 增长到 2026 年 4 月中旬的 ~9,400(+38%),官方 Registry 记录达 9,652 条,月度 SDK 下载量超过 9,700 万次。六个主流宿主平台(Claude Desktop、Claude Code、Cursor、Codex CLI、Windsurf、VS Code/Copilot)均已提供一等公民级 MCP 支持。

  • stdio:本地开发,客户端启动子进程
  • Streamable HTTP:远程服务,支持 SSE 实时流,兼容负载均衡器、代理和 CDN
  • Conformance Test Suites:自动化验证客户端、服务器和 SDK 是否正确实现规范,覆盖率随新功能扩展
  • Reference Implementations:新能力附带参考实现,而非仅提供文档
动态:一手资料追踪 8 分钟

A2A 协议 v1.0 发布分析:多 Agent 协作开始有了正式底座

A2A(Agent2Agent)v1.0 是首个正式宣称“production-ready”的 A2A 版本。它要解决的问题不是“一个 Agent 怎么调用工具”,而是“多个 Agent 怎么发现彼此、验证身份、委托任务、回传结果,并且在不同厂商和不同组织之间还能互通”。

  • 一个前台 Agent 对接用户
  • 多个专业 Agent 分工处理不同子任务
  • 不同团队、不同平台甚至不同公司之间交换 Agent 能力
  • 加密签名:通过密码学验证 Agent 身份,防止伪造