横评

AI Agent 工具与框架选型

工具、平台、框架和 SDK 的横向对比与选型建议。决定"用哪个"之前先看这里。

15 篇 · 最后更新：2026-07-01

AI 编程工具

横评:选型与取舍 13 分钟

2026 年 AI 编程 Agent 与工具选型报告

2025-2026 年，AI 编程工具的主线已经从"补全代码"走向"能读仓库、改文件、跑命令、接 CI/CD 的 Agent"。这篇文章把分散在多篇横评里的内容收口到一页：先看趋势，再按工作流选择 Cursor、Claude Code、GitHub Copilot、Devin Desktop、Aider、Continue、Trae、DeepSeek / Qwen Code 等工具。

先按控制面选：编辑器、终端、GitHub 工作流、开源可控、本土化低成本，仍然是五条不同路线。
路线正在合流：Cursor 补了 CLI 和并行 Agent；Devin Desktop 把编辑器、本地 Agent 和云端 Agent 接入同一条工作流；Claude Code 从终端工具变成可编排的软件工程环境。6 月 9 日发布的 Claude Fable 5 把模型能力又推了一档——Stripe 用它在 1 天内完成了 5000 万行 Ruby 代码库的全库迁移。
PR 自动审查：AI 分析每个 PR 的安全和质量
Issue 自动处理：标记为 auto-fix 的 Issue 自动修复

横评:选型与取舍 14 分钟

AI 编程 Agent 2026 年中更新：新能力、新玩家、新格局

这是一篇时效性年中更新，记录 2026 年 5-6 月 AI 编程工具市场的快速变化。它不是对完整选型报告的替代——完整报告包含趋势分析、六大趋势和全部工具横评。本文聚焦最近两个月发生的三件事：

大型重构场景验证通过：多文件迁移、批量测试修复、跨模块重命名——这些从"等 Claude 一个个处理"变成自动拆分并行
与 Auto mode 组合有效：Auto mode 解决了"频繁确认"，Dynamic Workflows 解决了"单 agent 瓶颈"
实际并行上限：社区反馈在 10-20 个并行 agent 范围内稳定，超过 30 个后协调开销明显上升
/cd（W24）：会话中途切换工作目录，不重建 prompt cache

横评:选型与取舍 4 分钟

Cursor vs Claude Code：怎么选

Cursor 是 AI 编辑器，Claude Code 是 AI 终端。选哪个取决于你的主战场在哪里：如果你大部分时间在编辑器里写代码、改 UI、做局部重构，用 Cursor；如果你需要 AI 读整个仓库、跑命令、改配置、接入 CI/CD，用 Claude Code。

横评:选型与取舍 8 分钟

Claude Code 深度评测：与 Copilot、Cursor 的全面对比

Claude Code 在 2026 年 6 月已经不是"终端版的 Cursor"，而是一个可编排、可验证、可审查的软件工程环境——Dynamic Workflows 让它自己调度数十到上百个并行 agent，Opus 4.8 提供目前最强的代码审查可靠性。选 Claude Code 当且仅当你需要 AI 理解整个仓库、执行复杂工作流、接入 CI/CD。如果你主要在编辑器里写 UI、做局部改动，Cursor 或 Copilot 仍然是更顺手的选择。

Dynamic Workflows——告诉 Claude 目标，它自己拆解任务、创建并调度数十到数百个后台 agent 并行运行，用 /workflows 查看执行状态
Auto mode——从 research preview 到推荐默认模式，权限判断交给分类器，减少每一步的人工确认
Computer use——终端里可以打开原生应用、点击 UI、验证界面变化，补上了 GUI 验证短板
Ultraplan / Monitor——云端起草计划 + 后台盯日志/CI/训练任务，形成"本地发起→云端执行→终端回收"的混合工作流

横评:选型与取舍 8 分钟

GitHub Copilot Coding Agent 实战：从 Issue 到 PR 的云端编程代理

GitHub Copilot Coding Agent 在 2026 年已经不只是“IDE 里的 Copilot 聊天框”。它更准确的官方名称是 Copilot Cloud Agent，也就是一个在 GitHub Actions 支持的临时环境中后台工作的云端代理。

Chat 更像实时副驾驶
Cloud Agent 更像后台接单的开发代理
研究仓库结构
创建实现计划

横评:选型与取舍 4 分钟

国产 AI 编程工具选型指南（2026）

国产 AI 编程工具在 2026 年的竞争焦点已经从"能不能补全代码"转向三个方向：Agent 化（自主完成分析-生成-测试流程）、IDE/插件双形态（独立 IDE 还是嵌入 VS Code）、企业级合规和私有化。

Ask 模式：代码问答、单文件编辑
Agent 模式：多文件协同编辑，理解项目上下文

横评:选型与取舍 5 分钟

AI 编程工具订阅方案对比：Claude Max / ChatGPT Pro / Cursor / GLM Coding Plan

AI 编程工具选型报告回答"用哪个工具"，落地成本对比回答"花多少 Token"。但很多人卡在更前一步：这些工具到底怎么买、买哪种订阅最划算——直接付 Claude Max $100，还是去用便宜得多的第三方聚合订阅？

优势：模型最强、Claude Code 深度集成、Prompt Caching 在长会话里省钱
劣势：贵；重度用户 $100/月仍可能不够；企业已切回按量计费
判断：每天 Claude Code 超过 2 小时，Max 5x 是性价比拐点
优势：推理模型 + 深度研究 + Codex CLI

Agent 基础设施

横评:选型与取舍 9 分钟

2026 年 AI Agent 基础设施全景报告：框架、协议、工具链与六个正在发生的趋势

2026 年的 AI Agent 生态已经不是一个"选哪个框架"的问题，而是一整套基础设施的成型。从 2025 年底的"百花齐放"到 2026 年中的"收敛与分层"，Agent 开发的基础设施经历了三个关键变化：

一个前台 Agent 对接用户，多个专业 Agent 分工处理子任务
不同团队、不同平台甚至不同公司之间交换 Agent 能力
Agent 之间的任务委托、结果回传、身份验证
你描述目标，Claude 自动拆解任务

Agent 框架与 SDK

横评:选型与取舍 7 分钟

AI Agent 框架横评 2026：LangGraph vs CrewAI vs Microsoft Agent Framework vs Google ADK vs AG2

2026 年，AI Agent 框架从"能跑 Demo"进入"工程化落地"阶段。2026 年 4 月，Microsoft Agent Framework 1.0 GA 正式发布，合并 AutoGen 和 Semantic Kernel 为一个统一 SDK，标志着框架生态从"百花齐放"走向"整合收敛"。当前五个主流框架各有定位：LangGraph 做流程控制、CrewAI 做角色协作、Microsoft Agent Framework 做企业级多 Agent 编排、Google ADK 做标准化互联、AG2 做社区驱动的多 Agent 协商。

横评:选型与取舍 5 分钟

主流 Agent SDK 对比：Claude / OpenAI / Google

2025-2026 年，三大 AI 公司各自推出了 Agent SDK，提供了构建 AI Agent 应用的官方工具包。本篇对比 Claude Agent SDK、OpenAI Agents SDK 和 Google ADK 的核心特性，帮助你做出技术选型。

内置工具执行：文件操作、命令执行、代码编辑、网页搜索开箱即用
安全设计：权限控制、工具白名单、沙盒执行
多步执行：自动规划和执行多步任务
TypeScript + Python 双语言支持

横评:选型与取舍 6 分钟

Agent SDK 框架 2026 年中选型指南

2026 年中选 Agent SDK，记住三条：已锁定 OpenAI 生态 → OpenAI Agents SDK，迭代最快、沙箱原生；需要精细控制工作流和状态 → LangGraph，1.2.x 稳定、生产验证充分；Google Cloud 用户 → Google ADK，2.0 已 GA、Workflow Runtime 开箱即用。Semantic Kernel 老用户应开始规划向 MAF 迁移；AG2 恢复了活跃迭代（0.13.3），但 v1.0 路线图意味着近期有 API 大改。

沙箱原生：SandboxAgent 支持本地 / 容器 / 托管三种后端，Agent 在隔离环境里操作文件系统和执行命令，代码生成和 DevOps 场景开箱即用
MCP 一等公民：工具注册、schema 自动生成、tracing 内建
Guardrails + Human-in-the-loop：输入输出校验 + 人工审批，适合有合规要求的流程
Provider-agnostic：0.15.0 起支持 100+ LLM，不限于 OpenAI

平台与生态

横评:选型与取舍 2 分钟

Agent 开发平台对比：Dify / Coze / Flowise

对于不想从零写代码构建 Agent 的用户，有一批低代码/无代码平台提供了可视化构建 AI Agent 的能力。本篇对比最受欢迎的四个平台：Dify、Coze（扣子）、Flowise 和 n8n。

114K+ GitHub Stars，最受欢迎的开源 LLM 应用平台
中国团队（LangGenius）开发，中文文档完善
支持自托管和云服务
企业内部 AI 工具平台

横评:选型与取舍 3 分钟

MCP Server 生态与实战用例 2026

MCP（Model Context Protocol）在 2026 年已经从"炫技式接工具"进入"真正能干活"的阶段。核心价值是把 Agent 从聊天机器人变成工作流入口——连接代码仓库、数据库、文档系统、SaaS 工具，形成"读数据—理解—行动"的闭环。

核心能力

横评:选型与取舍 3 分钟

Agent Memory 方案选型

Agent 记忆方案的选择直接影响 Agent 的能力上限和运维成本。选错了，要么 Agent "太笨"（记不住东西），要么成本失控（向量数据库 + 嵌入费用）。本文从实际场景出发，帮你选对记忆方案。

TypeScript strict mode
测试: vitest
不要用 any
API 层: src/routes/

横评:选型与取舍 6 分钟

AI Agent 落地成本全景对比：Token 到部署的 TCO 拆解

Agent 落地成本的核心认知有三条：模型选择决定 80% 的 Token 成本——用 Haiku 处理简单任务和用 Opus 处理同样的任务，成本差 6-8 倍；框架选择影响 Token 消耗量——不同框架的 prompt 结构和状态管理方式会导致 20-50% 的 token 开销差异；基础设施成本通常只占总 TCO 的 10-20%——真正的大头在 Token 和人力之间的权衡。算清楚这三笔账，Agent 落地才能避免"能力够用但账单失控"。

Prompt 结构：每个 Agent 定义需要 ~290-410 tokens 的工具使用系统提示（[Anthropic 定价页数据](https://platform.claude.com/docs/en/about-claude/pricing)），加上工具 schema 和 handoff 指令
Handoff 开销：每次 Agent 交接需要重传上下文，单次 handoff 约增加 500-2000 tokens
成本特点：轻量、线性——Agent 数量与 Token 消耗近似正比。适合简单 pipeline
状态持久化：每个 checkpoint 需要序列化完整状态，长对话中状态可能膨胀到 10K+ tokens/次