成本结构:真实数据
2026 年 5 月,Simon Willison 公开了他个人的 AI 编程工具月度消耗:
| 工具 | 30 天 API 等价成本 | 实际订阅费 | 折扣率 |
|---|---|---|---|
| Claude Code | $1,199.79 | $100(Max 计划) | ~92% |
| OpenAI Codex | $980.37 | $100(Pro 计划) | ~90% |
| 合计 | $2,180.16 | $200 | ~91% |
这是重度用户的数据。Simon 每天同时使用两个工具处理开源项目。对轻度用户来说,月度 API 等价成本通常在 $50-$200 之间。
关键认知:订阅制对个人开发者是大幅补贴,但企业客户已经不再享受这种折扣。详见 Anthropic 和 OpenAI 的 PMF 分析。
企业定价的拐点
2026 年 4 月是一个分水岭。两家公司几乎同时把企业定价从"包月"切换到"按 API 计费":
| 时间 | 事件 | 影响 |
|---|---|---|
| 2025-08 | Anthropic Enterprise: "每个座位包含足够日常使用的用量" | 包月制,成本可预测 |
| 2025-11 | Anthropic 续约切换为 $20/seat/月 + API 按量计费 | 现有客户续约时才发现 |
| 2026-04-02 | OpenAI Codex 从 per-message 改为 API token 计费 | 企业使用量直接挂钩 API 价格 |
| 2026-04-23 | OpenAI 所有 Enterprise 计划(含 Edu/Health/Gov)切换 | 两家定价与公开 API 价格完全一致 |
与此同时,新模型在涨价:
| 模型 | 发布时间 | 相对前代定价 |
|---|---|---|
| Opus 4.7 | 2026-04-16 | ~1.4x Opus 4.6(换了 tokenizer) |
| GPT-5.5 | 2026-04-23 | 2x GPT-5.4 |
| Opus 4.8 Fast mode | 2026-05 | 2x 标准费率,但 2.5x 速度 |
真实企业爆雷案例:
- Uber:2026 年才过了几个月就用完全年 AI 预算,主要来自 Claude Code 使用量
- 某匿名企业(Axios 报道):一个月花了 $5 亿,原因是给员工开放 Claude License 时没有设用量上限
- Microsoft:开始取消工程师的 Claude Code 许可,要求改用 Copilot——财务考量和产品竞争兼有
个人开发者成本控制
策略一:用订阅,不要用 API key
对重度用户来说,$100/月的订阅是目前性价比最高的方案:
个人开发者推荐方案:
├── 重度用户(日均 2h+):Max/Pro 计划 $100/月
├── 中度用户(日均 <1h):Team 计划或按需 API
└── 轻度用户(偶尔使用):免费额度 + 低端模型 API
如果你月均 API 等价消耗超过 $150,订阅制几乎一定更划算。
策略二:按任务复杂度选模型
不是所有任务都需要最强模型:
| 任务类型 | 推荐模型 | 预估单次成本 |
|---|---|---|
| 改变量名、加注释、格式化 | Haiku / GPT-4.1 mini | <$0.01 |
| 写 boilerplate、生成 CRUD | Sonnet / GPT-4.1 | $0.01-$0.05 |
| 调试复杂 bug、架构重构 | Opus / o3 | $0.10-$0.50 |
| 全项目迁移、多文件协调 | Opus + 多 Agent | $0.50-$5.00 |
| 代码审查 + 安全审计 | Opus(带完整上下文) | $0.30-$1.00 |
策略三:控制 effort 级别
Claude Code 的 /effort 命令直接影响 token 消耗:
# 简单任务用 low effort——省 token,速度快
/effort low
> 把这个函数的参数名改得更清晰
# 复杂任务用 high 或 max——投更多推理 token
/effort high
> 重构整个认证模块,支持 OAuth2 + SAML
# 默认是 medium,适合大多数日常任务
/effort medium
经验法则:能用 low 解决的不要用 medium,能 medium 搞定的不要 high。effort 每升一级,token 消耗大约增加 50-100%。
策略四:用 Codex 处理简单任务
Codex 和 Claude Code 的定位正在分化:
- Codex:适合定义明确、范围清晰的任务("给这个函数加单元测试"、"把这些 import 排序")
- Claude Code:适合需要理解项目上下文、多步协调的复杂任务
简单任务扔给 Codex,复杂任务交给 Claude Code。两者并用比单用任何一个都省钱。
团队/企业成本控制
上线前必做:设用量上限
Axios 报道的 $5 亿/月案例,根因就是没有设上限。部署任何 AI 编程工具给团队时,第一步:
# 企业部署 checklist
mandatory:
- [ ] 设置团队月度预算上限(建议:$50-$200/人/月起步)
- [ ] 设置单用户日消耗上限
- [ ] 开启用量告警(消耗达到 50%/80%/100% 时通知)
- [ ] 指定工具管理员(有权限调整上限和审查异常)
recommended:
- [ ] 按团队/项目分拆计费,方便追踪
- [ ] 要求员工完成基本培训后再开通(减少无效消耗)
- [ ] 制定模型使用策略(哪些场景可以用 Opus,哪些只能用 Sonnet)
模型使用策略模板
团队模型使用策略(示例):
Tier 1 — 默认允许:
Sonnet 4 / GPT-4.1
用途:代码补全、简单重构、文档生成、写测试
Tier 2 — 需要 TL 审批:
Opus 4 / o3
用途:架构设计、跨模块重构、安全审计
Tier 3 — 需要总监审批:
Opus 4.8 Fast mode + 多 Agent 协作
用途:全项目迁移、紧急生产问题排查
月度成本审查
建立一个简单的审查节奏:
| 频率 | 动作 | 责任人 |
|---|---|---|
| 每日 | 检查异常消耗 spike(单个用户突然飙到 $500+/天) | 工具管理员 |
| 每周 | 按团队汇总消耗,对比预算使用率 | Team Lead |
| 每月 | 全公司 AI 工具费用汇总 + ROI 评估 | Engineering VP |
Claude Code 成本监控工具
Claude Code 在近期更新中加入了细粒度的成本追踪功能。完整更新说明见 Claude Code 最新更新。
/usage — 按类别拆分消耗
> /usage
Token usage by category (last 30 days):
┌─────────────────┬───────────┬──────────┐
│ Category │ Tokens │ Est Cost │
├─────────────────┼───────────┼──────────┤
│ Skills │ 1,240K │ $89.20 │
│ Subagents │ 890K │ $64.00 │
│ Plugins │ 120K │ $8.60 │
│ MCP: GitHub │ 340K │ $24.50 │
│ MCP: Database │ 560K │ $40.30 │
│ Direct prompts │ 2,100K │ $151.20 │
└─────────────────┴───────────┴──────────┘
这个拆分能帮你找到成本热点。比如 MCP server 占比过高,可能意味着 Agent 在反复查询数据库——考虑优化 MCP 查询或减少上下文传递。
/usage-credits — 追踪额度消耗
> /usage-credits
Credits remaining: 847 / 1,000
Last reset: 2026-05-15
Projected usage: 623 credits remaining at cycle end
前身是 /extra-credits。帮你判断本月额度是否够用,是否需要调整使用策略。
在 Skill 中限制昂贵工具
Claude Code 的 Skill 系统支持 disallowed-tools frontmatter,防止 Skill 执行过程中调用高成本工具:
---
name: quick-refactor
description: 快速重构小模块
disallowed-tools:
- bash # 防止执行长时间运行的命令
- webfetch # 防止抓取大页面消耗上下文
---
只重构代码,不运行测试、不访问网络。
完成后列出修改的文件。
决策框架:什么时候用什么模型
把任务复杂度、模型选择、预期成本放在一个框架里看:
| 场景 | 推荐方案 | 预估月度成本/人 | 前提条件 |
|---|---|---|---|
| 个人学习/探索 | Max 或 Pro 计划 | $100 | 重度使用时订阅制远比 API 划算 |
| 小团队(<10人)开发 | Team 计划 + 用量告警 | $200-$500/团队 | 设好上限再开 |
| 中型企业(50-200人) | Enterprise API + 分组计费 | $5,000-$30,000 | 必须有模型使用策略 |
| 大企业(200+人) | Enterprise API + 预算硬上限 + 专职管理员 | $50,000+ | 参考上面 checklist |
| 单次大型迁移项目 | Opus 4.8 Fast + 子 Agent | $500-$5,000/项目 | 用 /effort 控制,定期 /usage 检查 |
快速决策树
你需要 AI 编程工具吗?
├── 个人使用
│ ├── 重度(日均 >2h)→ Max/Pro 计划 $100/月
│ └── 轻度(日均 <1h)→ Team 计划或 API 按量
├── 团队使用
│ ├── <10 人 → Team 计划 + 告警
│ ├── 10-50 人 → Enterprise + 分组计费 + 模型策略
│ └── >50 人 → Enterprise + 硬上限 + 专职管理 + 月度审查
└── 预算有限
├── 优先 Sonnet/Haiku 处理 80% 的日常任务
└── 只在关键决策点用 Opus