返回资料库 AI Agent 基础

AI Agent 核心模式详解

任何 Agent 系统的基础,都是一个配备了以下能力的 LLM:

来源:Anthropic - Building effective agents | 整理时间:2026-04-01


一、基础构件:增强型 LLM

任何 Agent 系统的基础,都是一个配备了以下能力的 LLM:

┌─────────────────────────────────┐
│         增强型 LLM              │
│  ┌─────────┐  ┌──────────────┐  │
│  │  检索   │  │   工具调用   │  │
│  └─────────┘  └──────────────┘  │
│  ┌─────────────────────────────┐ │
│  │         记忆系统            │ │
│  └─────────────────────────────┘ │
└─────────────────────────────────┘

推荐资源Model Context Protocol(MCP) — Anthropic 发布的工具集成标准,已成为行业事实标准


二、五大工作流模式

模式 1:提示链(Prompt Chaining)

适合:任务可以清晰分解为串行步骤

输入 → [LLM-1: 起草大纲] → [检查点] → [LLM-2: 撰写内容] → [检查点] → 输出

典型用例

  • 起草营销文案 → 翻译成多语言
  • 生成文档大纲 → 检查大纲质量 → 根据大纲撰写文档

模式 2:路由(Routing)

适合:不同类型输入需要不同处理方式

                     ┌→ [技术支持流程]
输入 → [分类器] ──────┼→ [退款处理流程]  
                     └→ [一般咨询流程]

典型用例

  • 客服系统(退款/技术/咨询)
  • 按复杂度路由到不同规模的模型

模式 3:并行化(Parallelization)

适合:可以同时处理、或需要多角度验证

                  ┌→ [LLM 实例 1] ┐
输入 ─→ [分发器] ─┼→ [LLM 实例 2] ┼→ [聚合器] → 输出
                  └→ [LLM 实例 3] ┘

两种变体

  • 分段(Sectioning):处理任务的不同部分
  • 投票(Voting):同一任务多实例运行,取最优

典型用例

  • 代码安全审查(多个视角同时检查)
  • 内容审核(不同维度并行评估)

模式 4:编排者-执行者(Orchestrator-Workers)

适合:无法预先确定所需步骤的复杂任务

         ┌─→ [Worker 1: 修改文件 A] ┐
输入 → [编排者] → [Worker 2: 修改文件 B] ┼→ [汇总] → 输出
         └─→ [Worker 3: 运行测试]   ┘

与并行化的区别:子任务不是预定义的,由编排者根据具体情况动态决定

典型用例

  • 复杂代码重构(改动多个文件)
  • 多源信息搜索和分析

模式 5:评估者-优化者(Evaluator-Optimizer)

适合:有明确评估标准、迭代改进有价值的任务

输入 → [生成者 LLM] → 草稿
                         ↓
                    [评估者 LLM] → 反馈
                         ↓
                    [生成者 LLM] → 改进版 → ...直到满意

典型用例

  • 文学翻译(精雕细琢)
  • 搜索任务(多轮搜索补充信息)

三、完整 Agent 架构

当以上模式无法预测路径时,使用完全自主的 Agent:

用户 ──→ [任务描述]
              ↓
         [Agent LLM]
              ↓
    ┌─────────────────┐
    │   工具调用循环   │
    │  ┌───────────┐   │
    │  │  执行工具  │   │
    │  └─────↑─────┘   │
    │         │结果     │
    │  ┌──────┴──────┐  │
    │  │  LLM 决策   │  │
    │  └─────────────┘  │
    └─────────────────┘
              ↓
         [任务完成]

Agent 适合

  • 开放式问题(步骤数无法预测)
  • SWE-bench 类代码任务
  • 复杂的计算机使用任务

四、工具设计原则(ACI:Agent-Computer Interface)

工具设计和提示词设计同样重要。原则如下:

  1. 清晰的工具描述:包含示例用法、边界情况、输入格式
  2. 参数名要直白:像给初级开发者写文档一样
  3. 避免错误诱导:用绝对路径代替相对路径(防止工作目录切换后出错)
  4. 测试工具使用情况:在真实场景中观察 Agent 如何使用你的工具

五、框架选择指南

何时使用框架(LangChain、LlamaIndex 等)

  • 快速原型验证
  • 标准 LLM 调用、工具定义

何时直接使用 API

  • 生产环境
  • 需要调试内部提示词/响应
  • 简单模式(几十行代码就能实现)

💡 Anthropic 建议:先从直接调用 API 开始,等需要时再引入框架


相关链接


本系列相关文章

常见问题

AI Agent 核心模式详解 适合什么读者?

AI Agent 核心模式详解 适合希望系统掌握 AI Agent 基础 的读者,尤其是需要从概念快速过渡到实践的人。页面包含主题摘要、相关阅读和来源链接,便于形成可执行的学习路径。

阅读 AI Agent 核心模式详解 需要多久?

当前页面预估阅读时长约 4 分钟。建议先读正文结论,再根据“同专题延伸”继续阅读,通常 20 到 40 分钟可以建立完整主题框架。

如何把 AI Agent 核心模式详解 的内容用于实际项目?

先按正文中的关键概念完成最小可运行示例,再把示例嵌入你当前项目流程。你可以结合来源链接验证细节,并使用同专题文章补齐部署、协作和评估步骤。