来源:Anthropic - Building effective agents | 整理时间:2026-04-01
Agent 是什么?
"Agent"(智能体)可以从多个角度来理解:
- 狭义定义:能在较长时间内自主运行、使用各种工具完成复杂任务的全自动系统
- 广义定义:所有由 LLM 驱动的自主工作流都可以称为 Agentic System
Anthropic 将这类系统统称为 Agentic Systems(智能体系统),并区分为两种类型:
| 类型 | 定义 | 特点 |
|---|---|---|
| Workflow(工作流) | LLM 通过预定义的代码路径执行任务 | 可预测、一致性强 |
| Agent(智能体) | LLM 动态决定流程和工具使用方式 | 灵活、模型驱动 |
Agent 的核心构成
基础构件:增强型 LLM
最基本的构件是 增强了以下能力的 LLM:
- 检索(Retrieval):主动搜索相关信息
- 工具(Tools):调用外部 API 和服务
- 记忆(Memory):保留重要上下文
典型工作流模式
1. 提示链(Prompt Chaining)
将任务分解为顺序步骤,前一步的输出作为下一步的输入。
任务 → LLM 步骤 1 → [检查点] → LLM 步骤 2 → [检查点] → 输出
适用场景:任务可以清晰分解为固定子任务时
2. 路由(Routing)
对输入进行分类,然后分发到专门的后续处理流程。
适用场景:不同类型的输入需要不同处理方式(如客服系统中的退款、技术支持、一般咨询)
3. 并行化(Parallelization)
LLM 同时处理多个任务,结果汇总。有两种变体:
- 分段(Sectioning):将任务拆分为并行子任务
- 投票(Voting):同一任务运行多次获得多样性输出
4. 编排者-执行者(Orchestrator-Workers)
中央 LLM 动态分解任务,分配给工作 LLM,汇总结果。
适用场景:无法预先确定子任务数量和性质的复杂任务
5. 评估者-优化者(Evaluator-Optimizer)
一个 LLM 生成输出,另一个评估并提供反馈,循环迭代。
何时使用 Agent?
推荐使用场景
- 问题是开放式的,难以预测所需步骤数量
- 无法预先编写固定路径
- 需要在可信环境中扩展任务规模
- 有充分的测试和沙箱保障
不推荐使用场景
- 简单任务,单次 LLM 调用足够
- 需要极低延迟的应用
- 成本敏感的场景(Agent 费用更高)
💡 黄金法则:先找最简单的解决方案。只有当简单方法确实不够时,才增加复杂度。
Agent 的核心原则
Anthropic 总结了构建 Agent 的三条核心原则:
- 保持设计简单(Maintain simplicity)
- 透明展示规划步骤(Prioritize transparency)
- 精心设计 Agent-Computer 接口(ACI),包括完善的工具文档和测试
AI Agent 的实际应用案例
1. 客服 Agent
- 结合对话界面与工具集成(查询订单、知识库、处理退款)
- 多家公司已采用按成功解决率计费的模型
2. 代码 Agent
- 可根据 GitHub Issue 描述自动解决问题
- 通过自动化测试验证修复结果
- 在 SWE-bench 基准测试中表现优秀
延伸阅读
- Building effective agents - Anthropic — 官方深度文章
- Claude Agent SDK Overview — 用 SDK 构建 Agent
- Model Context Protocol (MCP) — Agent 工具集成标准
下一步