返回资料库 打底:概念与协议

使用 AI Agent 前你需要知道的安全常识

AI Agent 能帮你完成很多事,但它也有风险和局限。和任何强大的工具一样,了解它的边界才能用得更安心。

整理时间:2026-04-19


为什么要关注安全?

AI Agent 能帮你完成很多事,但它也有风险和局限。和任何强大的工具一样,了解它的边界才能用得更安心。

这篇文章面向所有 Agent 使用者,用通俗的语言讲清楚最重要的几个安全问题。


1. 数据隐私:你的信息去了哪?

风险

当你和 AI Agent 对话、上传文件或连接知识库时,你的数据可能会:

  • 被发送到云端 AI 服务商的服务器
  • 被用于模型训练(取决于服务商的政策)
  • 在传输过程中被截获(如果没有加密)

怎么保护自己

做法 说明
阅读隐私政策 使用前了解服务商是否会用你的数据训练模型
关闭训练数据共享 ChatGPT、Claude 等都有"不用于训练"的设置选项
不上传敏感信息 身份证号、银行卡号、公司机密文件不要直接发给 Agent
使用本地部署方案 OpenClaw 等开源方案可以把 Agent 运行在你自己的设备上
使用企业版 企业版通常有更严格的数据隔离和合规保障

各平台数据政策速览

平台 默认训练? 可关闭? 企业版隔离
ChatGPT 免费版是 企业版完全隔离
Claude API 版完全隔离
Coze 参见条款 部分 企业版可协商
Dify(自部署) 完全本地
OpenClaw 完全本地

2. AI 幻觉:Agent 会"一本正经地胡说八道"

风险

AI 模型有时会生成看起来很有道理但完全错误的内容,这叫"幻觉"(Hallucination)。常见情况:

  • 编造不存在的数据或引用
  • 给出过时的信息
  • 在不确定时不会说"我不知道",而是编一个答案

怎么应对

做法 说明
重要信息必须验证 不要把 Agent 的回答当作唯一信息源
要求引用来源 让 Agent 说明信息出处,方便你核实
使用知识库模式 限定 Agent 只从你上传的文档中回答,减少编造
关注模型更新日期 了解模型的知识截止日期,超出范围的信息可能不准确

3. 权限控制:Agent 能做什么,你说了算

风险

某些 Agent(如 OpenClaw、Claude Code)可以:

  • 读写你电脑上的文件
  • 执行命令行操作
  • 访问互联网
  • 发送消息

如果权限给得太宽,可能会发生意外操作。

怎么保护自己

做法 说明
最小权限原则 只给 Agent 完成任务所需的最低权限
审查敏感操作 大多数工具在执行删除、发送等操作前会要求确认
使用沙箱环境 测试新的 Agent 时,不要直接在生产环境运行
定期检查权限 查看 Agent 连接了哪些服务,移除不再需要的

4. 付费陷阱:不知不觉花了很多钱

风险

AI Agent 的背后是 AI 模型 API 调用,每次调用都有成本:

  • 按 token(字符数)计费,长对话和大文件会迅速消耗额度
  • 使用多个工具的 Agent 每次任务可能调用多次 API
  • 有些平台的定价不够透明

怎么控制成本

做法 说明
了解计费方式 使用前弄清楚是按次、按 token、还是包月
设置消费上限 大多数平台支持设置月度消费限额
选择合适的模型 简单任务用小模型,复杂任务才用大模型
使用免费额度测试 先用免费额度确认效果,满意了再付费
考虑本地部署 用开源模型 + 本地部署可以避免持续的 API 费用

主流平台价格参考

平台 免费额度 付费价格 模型
ChatGPT 有限免费 Plus $20/月 GPT-4o
Claude 有限免费 Pro $20/月 Claude Sonnet/Opus
Coze 国内版较充裕 按用量 多模型可选
Dify Cloud 200 次/月 按用量阶梯 自选 API
OpenClaw 免费(开源) 仅付 API 费用 自选

5. 依赖风险:不要把所有鸡蛋放在一个篮子里

风险

  • 平台停止服务或改变政策
  • API 价格大幅上涨
  • 功能被移除或限制

怎么应对

  • 重要数据始终保留本地备份
  • 不要把核心业务流程完全依赖单一 AI 平台
  • 了解替代方案,保持切换的灵活性

安全检查清单

在使用任何 AI Agent 之前,过一遍这个清单:

  • 我知道我的数据会被发送到哪里
  • 我关闭了不必要的数据训练共享
  • 我不会上传包含敏感个人信息的文件
  • 我会验证 Agent 给出的重要信息
  • 我清楚 Agent 有哪些权限
  • 我了解使用成本并设置了消费上限
  • 我有数据的本地备份

相关链接

常见问题

使用 AI Agent 前你需要知道的安全常识 适合什么读者?

想搞清楚 打底 这一块的人,尤其是从概念跨到能动手做的过渡阶段。页面带摘要、同主题延伸和来源链接,你不用再去满网找。

阅读 使用 AI Agent 前你需要知道的安全常识 需要多久?

预计 2 分钟。看不下去就跳到结论部分,把感兴趣的小节做个标记,后面再回来。

怎么把 使用 AI Agent 前你需要知道的安全常识 用在自己的项目里?

挑一个文章里的最小例子先跑通,跑通之后再拿到自己的项目里。卡住的地方对照来源链接核验细节,部署和评估的部分可以从同主题其他文章补。