实战

AI Agent 开发实战与教程

工具配置、框架上手、MCP 开发和 AI Coding 工作流。每篇都服务于把东西做出来。

23 篇 · 最后更新：2026-07-01

快速开始

实战:路径与工作流 6 分钟

AI Agent 零基础入门教程：5步搭建你的第一个 Agent

新手可以先把 Agent 理解成一个“会反复思考并调用工具的循环”：模型先理解任务，需要外部信息时调用工具或读取记忆，关键步骤经过检查点，最后再输出结果。后面所有复杂框架，本质上都是在这条基础循环上增加编排、权限和状态管理。

你的任务需要多步骤吗？如果单次对话就能完成，不需要 Agent
任务需要使用外部工具吗？比如读文件、调 API、执行代码
需要记忆上下文吗？跨对话保持记忆
在 Telegram/WhatsApp 上聊天即可控制

Claude Code

实战:路径与工作流 3 分钟

Claude Code 快速入门

Claude Code 是 Anthropic 的 AI 编程助手，在终端、IDE 和浏览器中运行。它和网页版 Claude 的核心区别：能直接读写你电脑上的文件、执行命令、管理 Git。

Claude Code 可以操作你电脑上的文件 → 参见 [Agent 安全指南](../foundations/agent-safety-guide.md)
重要操作前它会征求确认
API 费用按使用量计算，注意设置消费上限

实战:路径与工作流 8 分钟

Claude Code 最佳实践与工作流

Claude Code 的所有最佳实践都围绕一个约束：上下文窗口会快速填满，越满性能越差。上下文包含对话历史 + 读取的文件 + 命令输出。

Agent 1: Refactor login flow
Agent 2: Refactor token management
Agent 3: Refactor session handling
uses: actions/checkout@v4

实战:路径与工作流 6 分钟

Claude Code IDE 集成实战：VS Code 与 JetBrains 怎么选、怎么配

很多人第一次接触 Claude Code，是从终端里的 claude 开始的。但到 2026 年，VS Code 和 JetBrains 插件已经足够成熟，Claude Code 不再只是“命令行助手”，而是可以直接嵌进日常编辑器工作流。

直接在编辑器里发起会话，不用频繁切回终端
用 IDE 原生 diff 视图审查修改
自动把当前选中代码、诊断信息和文件路径带给 Claude
让 Claude 和你现有的编码、调试、审查流程合并在一起

实战:路径与工作流 5 分钟

CLAUDE.md 完全指南：让 AI 记住你的项目规范

CLAUDE.md 是 Claude Code 的项目记忆文件。每次会话开始时，Claude 会自动读取它，了解你的项目规范、技术栈和工作流偏好。

npm run dev — 启动开发服务器
npm run build — 生产构建
npm test — 运行测试
使用 TypeScript strict mode

实战:路径与工作流 9 分钟

Claude Code Dynamic Workflows 实战指南

Dynamic Workflows 是 Claude Code v2.1.154（2026 年 5 月 28 日）引入的核心功能。在此之前的 Claude Code 是单 agent 架构——你发出指令，一个 agent 串行处理所有步骤。即使 claude agents 能创建后台会话，每个会话仍然是独立的 agent，需要你手动拆分任务和协调结果。

Subagent 数量没有公开上限，但实际受 API rate limit 和费用限制。大型 workflow（100+ agents）需要关注 /usage
Subagent 之间不共享上下文——每个 subagent 是独立的会话。如果任务之间有强依赖，协调开销会比较大
调试困难——如果一个 subagent 出了问题，你需要单独查看那个 agent 的日志，不如单 agent 调试直观
结果合并需要审查——多个 subagent 同时修改代码时，可能产生冲突。建议在 worktree 隔离环境中运行

Agent SDK

实战:路径与工作流 8 分钟

OpenAI Agents SDK 实战指南（2026）

OpenAI Agents SDK 是面向生产环境的 Agent 开发框架。2026 年上半年的更新把它从"轻量编排工具"推进到"沙箱原生的 Agent 运行时"：

SandboxAgent（0.14.0 起）：隔离的文件系统和命令执行环境，支持快照和断点恢复
100+ LLM 支持（0.15.0 起）：provider-agnostic，不限于 OpenAI 模型
MCP 一等公民：工具注册、schema 自动生成、tracing 内建
AGENTS.md：项目级自定义指令，类似 Claude Code 的 CLAUDE.md

实战:路径与工作流 8 分钟

Claude Agent SDK：用代码构建 AI Agent 应用

Claude Agent SDK 是 Anthropic 推出的编程式 Agent 开发接口，让你可以用 Python 或 TypeScript 代码调用 Claude Code 的全部能力——包括代码理解、文件编辑、命令执行、多 Agent 协作等。

实战:路径与工作流 9 分钟

OpenAI Agents SDK JS/TS 快速入门

推荐路线：先做一个单 Agent + 一个工具的闭环，不要一上来做多 Agent。等你能稳定观测输入、工具调用、最终输出后，再考虑 handoffs、sessions 和 tracing。

沙箱环境变量解析器在 Manifest 合并时不再丢失（之前合并多个 Manifest 可能覆盖 env 配置）
Blaxel 沙箱提供方行为对齐修复
Tracing 关闭改为 best-effort，超时时主动中止导出，不再阻塞进程退出
空 chat completions 工具输出不再发送

Agent 框架

实战:路径与工作流 10 分钟

LangGraph 实战：构建图式多 Agent 工作流

LangGraph 是 LangChain 团队推出的图式 Agent 编排框架。它把 Agent 工作流建模为有向图（Directed Graph），每个节点是一个处理步骤，边定义了步骤之间的流转关系。

精确控制：不像纯 Agent 那样不可预测，你可以定义每一步做什么
状态管理：状态在节点间自动传递，支持持久化和恢复
人机交互：在关键节点暂停，等待人类审批后继续
多 Agent：支持多个 Agent 在同一个图中协作

实战:路径与工作流 8 分钟

AG2 实战：开源多 Agent 协作框架

AG2 是由 AutoGen 原作者 Chi Wang 和 Qingyun Wu 创建的开源多 Agent 协作框架。它延续了 AutoGen v0.2 的对话式架构，提供了简洁、同步的 API，非常适合快速构建多 Agent 应用。

实战:路径与工作流 9 分钟

Semantic Kernel 实战：微软生态里的 Agent 编排框架

Semantic Kernel 是微软开源的一个 Agent 编排 SDK。它不是一个拖拽式平台，而是一层可以嵌入到现有应用里的 Agent 中间件，适合你在已有业务系统中加入大模型、工具调用、多 Agent 协作和流程编排能力。

Triage Agent：先分流，再交给专门 Agent 处理
Review Agent：先生成，再交给审查 Agent 校验
Human in the loop：关键步骤必须人工确认
模型服务由 service 提供

MCP 开发

实战:路径与工作流 4 分钟

MCP Inspector 调试实战：本地开发、CLI 自动化与安全配置

很多 MCP Server 不是“写不出来”，而是“调不明白”。

服务器到底暴露了哪些 tools/resources/prompts？
某个 tool 为什么调用失败？参数还是权限问题？
在真实客户端（Claude Code/Cursor）接入前，服务器是否可用？
UI: 6274

Agent 引导与优化

实战:路径与工作流 6 分钟

Stripe 实验告诉你：AI Agent 不吃"软引导"这一套

Stripe 的开发者体验团队在 2026 年初做了一个系列实验，试图回答一个很实际的问题：怎么让 AI Agent 正确使用你的 API？

被动提示几乎全部失败——Agent 不读 AGENTS.md、不看 warnings、不浏览依赖目录
主动引导和分发策略有效——部分实验效果好得出乎意料
单一大文件：所有内容塞在一个文件里
模块化结构：顶层 skill 引用可按需加载的子 skill

生产化与评估

实战:路径与工作流 5 分钟

Agent 部署与生产化指南

把 Agent 从本地 Demo 推到生产环境，需要解决五个问题：在哪里运行、怎么监控、怎么控制成本、怎么管理版本、怎么保障安全。本篇不讲特定框架的部署步骤（那些看官方文档就行），而是梳理通用的生产化决策框架。

单日支出上限：设置硬限制，超限自动停止
单次调用上限：超过阈值的调用记录告警
异常模式检测：Agent 进入循环时快速检测和终止
Prompt 变更 = 版本变更

实战:路径与工作流 7 分钟

Agent 部署实操指南：从本地到生产的四种方案

你已经在本地跑通了一个 Agent Demo——可能是跟着 AI 编程趋势日报 Agent 做的，也可能是自己的项目。现在你想让它每天自动运行、或者让团队成员通过 API 调用。

Workers 限制：https://developers.cloudflare.com/workers/platform/limits/
Docker 文档：https://docs.docker.com/
Fly.io 限制：https://fly.io/docs/about/pricing/

实战:路径与工作流 7 分钟

Agent 测试与评估实战

Agent 的行为不确定——同一个提示可能因为上下文、模型版本或工具状态产生不同结果。这使得测试和评估成为 Agent 生产化的核心挑战。本篇提供一套可落地的评估框架：从单元测试到生产监控，从人工评审到 LLM 自动评审。

正确性 (1-5): 是否正确完成了任务
完整性 (1-5): 是否覆盖了所有要求
安全性 (1-5): 是否避免了危险操作和泄露
先覆盖核心路径，再扩展边缘场景

AI 编程工具

实战:路径与工作流 6 分钟

OpenAI Codex CLI 入门指南

Codex CLI 是 OpenAI 的终端编程 Agent，能直接在你本地机器上读取、修改、运行代码。和 Claude Code 定位类似——都是"终端里的 AI 程序员"——但有几个关键区别：

macOS / Linux / Windows（含 WSL2）均可
需要一个 ChatGPT 账号（Free / Plus / Pro / Business / Edu / Enterprise 均可）或 OpenAI API Key
日常任务用 GPT-5.4-mini，复杂任务切 GPT-5.5
控制 AGENTS.md 大小——项目指令越长，每次请求的 token 越多

实战:路径与工作流 7 分钟

AI 编程工具成本控制指南

2026 年 5 月，Simon Willison 公开了他个人的 AI 编程工具月度消耗：

Uber：2026 年才过了几个月就用完全年 AI 预算，主要来自 Claude Code 使用量
某匿名企业（Axios 报道）：一个月花了 $5 亿，原因是给员工开放 Claude License 时没有设用量上限
Microsoft：开始取消工程师的 Claude Code 许可，要求改用 Copilot——财务考量和产品竞争兼有
Codex：适合定义明确、范围清晰的任务（"给这个函数加单元测试"、"把这些 import 排序"）

安全实践

实战:路径与工作流 10 分钟

Agent 沙箱实战：从本地到生产的安全边界

Anthropic 公开了自己的沙箱架构和安全事件（参见 Anthropic 沙箱架构解读），核心教训是：标准隔离组件（gVisor、seccomp、hypervisor）扛住了考验，出问题的都是自己写的组件。

/tmp:size=100M
no-new-privileges:true
AGENTSESSIONID=${BUILD_ID}
LLMAPIKEY=${SCOPEDAPIKEY}

实战模式

实战:路径与工作流 5 分钟

Claude Code 实战项目：用 AI Agent 完成真实开发任务

很多开发者对 Claude Code 的第一印象是"能写代码的聊天工具"。但实际上，Claude Code 最强的地方是用 Agent 的方式完成有边界的真实开发任务——不是让它从零写一个完整应用，而是让它在一个已有代码库中完成可验证、可回滚的工作。

Runtime: Node.js 20+
语言: TypeScript (strict mode)
框架: 正在从 Express 迁移到 Fastify
测试: Vitest