返回资料库 AI Agent 基础

什么是 AI Agent?零基础入门指南

Anthropic 将这类系统统称为 Agentic Systems(智能体系统),并区分为两种类型:

来源:Anthropic - Building effective agents | 整理时间:2026-04-01


Agent 是什么?

"Agent"(智能体)可以从多个角度来理解:

  • 狭义定义:能在较长时间内自主运行、使用各种工具完成复杂任务的全自动系统
  • 广义定义:所有由 LLM 驱动的自主工作流都可以称为 Agentic System

Anthropic 将这类系统统称为 Agentic Systems(智能体系统),并区分为两种类型:

类型 定义 特点
Workflow(工作流) LLM 通过预定义的代码路径执行任务 可预测、一致性强
Agent(智能体) LLM 动态决定流程和工具使用方式 灵活、模型驱动

Agent 的核心构成

基础构件:增强型 LLM

最基本的构件是 增强了以下能力的 LLM

  • 检索(Retrieval):主动搜索相关信息
  • 工具(Tools):调用外部 API 和服务
  • 记忆(Memory):保留重要上下文

典型工作流模式

1. 提示链(Prompt Chaining)

将任务分解为顺序步骤,前一步的输出作为下一步的输入。

任务 → LLM 步骤 1 → [检查点] → LLM 步骤 2 → [检查点] → 输出

适用场景:任务可以清晰分解为固定子任务时

2. 路由(Routing)

对输入进行分类,然后分发到专门的后续处理流程。

适用场景:不同类型的输入需要不同处理方式(如客服系统中的退款、技术支持、一般咨询)

3. 并行化(Parallelization)

LLM 同时处理多个任务,结果汇总。有两种变体:

  • 分段(Sectioning):将任务拆分为并行子任务
  • 投票(Voting):同一任务运行多次获得多样性输出

4. 编排者-执行者(Orchestrator-Workers)

中央 LLM 动态分解任务,分配给工作 LLM,汇总结果。

适用场景:无法预先确定子任务数量和性质的复杂任务

5. 评估者-优化者(Evaluator-Optimizer)

一个 LLM 生成输出,另一个评估并提供反馈,循环迭代。


何时使用 Agent?

推荐使用场景

  • 问题是开放式的,难以预测所需步骤数量
  • 无法预先编写固定路径
  • 需要在可信环境中扩展任务规模
  • 有充分的测试和沙箱保障

不推荐使用场景

  • 简单任务,单次 LLM 调用足够
  • 需要极低延迟的应用
  • 成本敏感的场景(Agent 费用更高)

💡 黄金法则:先找最简单的解决方案。只有当简单方法确实不够时,才增加复杂度。


Agent 的核心原则

Anthropic 总结了构建 Agent 的三条核心原则:

  1. 保持设计简单(Maintain simplicity)
  2. 透明展示规划步骤(Prioritize transparency)
  3. 精心设计 Agent-Computer 接口(ACI),包括完善的工具文档和测试

AI Agent 的实际应用案例

1. 客服 Agent

  • 结合对话界面与工具集成(查询订单、知识库、处理退款)
  • 多家公司已采用按成功解决率计费的模型

2. 代码 Agent

  • 可根据 GitHub Issue 描述自动解决问题
  • 通过自动化测试验证修复结果
  • 在 SWE-bench 基准测试中表现优秀

延伸阅读


下一步

常见问题

什么是 AI Agent?零基础入门指南 适合什么读者?

什么是 AI Agent?零基础入门指南 适合希望系统掌握 AI Agent 基础 的读者,尤其是需要从概念快速过渡到实践的人。页面包含主题摘要、相关阅读和来源链接,便于形成可执行的学习路径。

阅读 什么是 AI Agent?零基础入门指南 需要多久?

当前页面预估阅读时长约 3 分钟。建议先读正文结论,再根据“同专题延伸”继续阅读,通常 20 到 40 分钟可以建立完整主题框架。

如何把 什么是 AI Agent?零基础入门指南 的内容用于实际项目?

先按正文中的关键概念完成最小可运行示例,再把示例嵌入你当前项目流程。你可以结合来源链接验证细节,并使用同专题文章补齐部署、协作和评估步骤。