实战

AI Agent 开发教程与实战

工具配置、框架上手、MCP 开发和 AI Coding 工作流。每篇都服务于把东西做出来。

15 篇 · 最后更新:2026-05-16

快速开始
实战:路径与工作流 6 分钟

AI Agent 零基础入门教程:5步搭建你的第一个 Agent

新手可以先把 Agent 理解成一个“会反复思考并调用工具的循环”:模型先理解任务,需要外部信息时调用工具或读取记忆,关键步骤经过检查点,最后再输出结果。后面所有复杂框架,本质上都是在这条基础循环上增加编排、权限和状态管理。

  • 你的任务需要多步骤吗? 如果单次对话就能完成,不需要 Agent
  • 任务需要使用外部工具吗? 比如读文件、调 API、执行代码
  • 需要记忆上下文吗? 跨对话保持记忆
  • 在 Telegram/WhatsApp 上聊天即可控制
Claude Code
实战:路径与工作流 3 分钟

Claude Code 快速入门

Claude Code 是 Anthropic 的 AI 编程助手,在终端、IDE 和浏览器中运行。它和网页版 Claude 的核心区别:能直接读写你电脑上的文件、执行命令、管理 Git。

  • Claude Code 可以操作你电脑上的文件 → 参见 [Agent 安全指南](../foundations/agent-safety-guide.md)
  • 重要操作前它会征求确认
  • API 费用按使用量计算,注意设置消费上限
实战:路径与工作流 6 分钟

Claude Code IDE 集成实战:VS Code 与 JetBrains 怎么选、怎么配

很多人第一次接触 Claude Code,是从终端里的 claude 开始的。但到 2026 年,VS Code 和 JetBrains 插件已经足够成熟,Claude Code 不再只是“命令行助手”,而是可以直接嵌进日常编辑器工作流。

  • 直接在编辑器里发起会话,不用频繁切回终端
  • 用 IDE 原生 diff 视图审查修改
  • 自动把当前选中代码、诊断信息和文件路径带给 Claude
  • 让 Claude 和你现有的编码、调试、审查流程合并在一起
实战:路径与工作流 8 分钟

Claude Code 最佳实践与工作流

Claude Code 的所有最佳实践都围绕一个约束:上下文窗口会快速填满,越满性能越差。上下文包含对话历史 + 读取的文件 + 命令输出。

  • Agent 1: Refactor login flow
  • Agent 2: Refactor token management
  • Agent 3: Refactor session handling
  • uses: actions/checkout@v4
实战:路径与工作流 5 分钟

CLAUDE.md 完全指南:让 AI 记住你的项目规范

CLAUDE.md 是 Claude Code 的项目记忆文件。每次会话开始时,Claude 会自动读取它,了解你的项目规范、技术栈和工作流偏好。

  • npm run dev — 启动开发服务器
  • npm run build — 生产构建
  • npm test — 运行测试
  • 使用 TypeScript strict mode
Agent SDK
实战:路径与工作流 8 分钟

Claude Agent SDK:用代码构建 AI Agent 应用

Claude Agent SDK 是 Anthropic 推出的编程式 Agent 开发接口,让你可以用 Python 或 TypeScript 代码调用 Claude Code 的全部能力——包括代码理解、文件编辑、命令执行、多 Agent 协作等。

实战:路径与工作流 7 分钟

OpenAI Agents SDK 实战指南(2026)

OpenAI Agents SDK 是面向生产环境的 Agent 开发框架。2026 年 4-5 月的更新把它从"轻量编排工具"推进到"沙箱原生的 Agent 运行时":

  • SandboxAgent:隔离的文件系统和命令执行环境,支持快照和断点恢复
  • MCP 一等公民:工具注册、schema 自动生成、tracing 内建
  • AGENTS.md:项目级自定义指令,类似 Claude Code 的 CLAUDE.md
  • Voice / RealtimeAgent:语音打断、轮次管理、guardrails(TS SDK)
实战:路径与工作流 7 分钟

OpenAI Agents SDK JS/TS 快速入门

OpenAI Agents SDK 的 JavaScript/TypeScript 版适合把 Agent 嵌进 Node.js 应用、后台任务和 Web 产品后端。它不是 Claude Code 这类交互式编程工具,而是一个可编程运行时:你定义 Agent、工具、运行方式和错误处理,再把它接到自己的业务系统里。

Agent 框架
实战:路径与工作流 10 分钟

LangGraph 实战:构建图式多 Agent 工作流

LangGraph 是 LangChain 团队推出的图式 Agent 编排框架。它把 Agent 工作流建模为有向图(Directed Graph),每个节点是一个处理步骤,边定义了步骤之间的流转关系。

  • 精确控制:不像纯 Agent 那样不可预测,你可以定义每一步做什么
  • 状态管理:状态在节点间自动传递,支持持久化和恢复
  • 人机交互:在关键节点暂停,等待人类审批后继续
  • 多 Agent:支持多个 Agent 在同一个图中协作
实战:路径与工作流 8 分钟

AG2 实战:开源多 Agent 协作框架

AG2 是由 AutoGen 原作者 Chi Wang 和 Qingyun Wu 创建的开源多 Agent 协作框架。它延续了 AutoGen v0.2 的对话式架构,提供了简洁、同步的 API,非常适合快速构建多 Agent 应用。

实战:路径与工作流 8 分钟

Semantic Kernel 实战:微软生态里的 Agent 编排框架

Semantic Kernel 是微软开源的一个 Agent 编排 SDK。它不是一个拖拽式平台,而是一层可以嵌入到现有应用里的 Agent 中间件,适合你在已有业务系统中加入大模型、工具调用、多 Agent 协作和流程编排能力。

  • Triage Agent:先分流,再交给专门 Agent 处理
  • Review Agent:先生成,再交给审查 Agent 校验
  • Human in the loop:关键步骤必须人工确认
  • 模型服务由 service 提供
MCP 开发
生产化与评估
实战:路径与工作流 5 分钟

Agent 部署与生产化指南

把 Agent 从本地 Demo 推到生产环境,需要解决五个问题:在哪里运行、怎么监控、怎么控制成本、怎么管理版本、怎么保障安全。本篇不讲特定框架的部署步骤(那些看官方文档就行),而是梳理通用的生产化决策框架。

  • 单日支出上限:设置硬限制,超限自动停止
  • 单次调用上限:超过阈值的调用记录告警
  • 异常模式检测:Agent 进入循环时快速检测和终止
  • Prompt 变更 = 版本变更
实战:路径与工作流 6 分钟

Agent 测试与评估实战

Agent 的行为不确定——同一个提示可能因为上下文、模型版本或工具状态产生不同结果。这使得测试和评估成为 Agent 生产化的核心挑战。本篇提供一套可落地的评估框架:从单元测试到生产监控,从人工评审到 LLM 自动评审。

  • 正确性 (1-5): 是否正确完成了任务
  • 完整性 (1-5): 是否覆盖了所有要求
  • 安全性 (1-5): 是否避免了危险操作和泄露
  • 先覆盖核心路径,再扩展边缘场景
实战模式
实战:路径与工作流 5 分钟

Claude Code 实战项目:用 AI Agent 完成真实开发任务

很多开发者对 Claude Code 的第一印象是"能写代码的聊天工具"。但实际上,Claude Code 最强的地方是用 Agent 的方式完成有边界的真实开发任务——不是让它从零写一个完整应用,而是让它在一个已有代码库中完成可验证、可回滚的工作。

  • Runtime: Node.js 20+
  • 语言: TypeScript (strict mode)
  • 框架: 正在从 Express 迁移到 Fastify
  • 测试: Vitest