返回资料库 Agent 框架实战

OpenManus:开源通用 Agent 实战

OpenManus 是一个开源通用 AI Agent,由 MetaGPT 团队成员开发,在 2025 年初迅速走红。它受 Manus(商业 AI Agent)启发,提供了一个可以自主完成各种任务的开源替代方案。

来源:github.com/mannaandpoem/OpenManus | 整理时间:2026-04-04


什么是 OpenManus?

OpenManus 是一个开源通用 AI Agent,由 MetaGPT 团队成员开发,在 2025 年初迅速走红。它受 Manus(商业 AI Agent)启发,提供了一个可以自主完成各种任务的开源替代方案。

核心特点

  • 通用 Agent:不限于特定领域,可处理多种任务
  • 自主规划:自动分解任务、制定执行计划
  • 工具使用:内置浏览器、代码执行、文件操作等工具
  • 开源免费:可自由修改和部署

安装与配置

环境要求

  • Python 3.10+
  • API Key(OpenAI 或 Anthropic)

安装

# 克隆仓库
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

# 安装依赖
pip install -r requirements.txt

# 配置 API Key
cp config.example.yaml config.yaml
# 编辑 config.yaml,填入你的 API Key

配置文件

# config.yaml
llm:
  model: "claude-sonnet-4-6"
  api_key: "your-api-key"
  # 或使用 OpenAI
  # model: "gpt-4o"
  # api_key: "your-openai-key"

tools:
  browser:
    enabled: true
    headless: true
  code_executor:
    enabled: true
    sandbox: true
  file_ops:
    enabled: true
    base_dir: "./workspace"

架构概述

执行循环

OpenManus 遵循经典的 Agent 执行循环:

[用户输入]
    ↓
[任务分析] → 分解为子任务
    ↓
[规划] → 制定执行计划
    ↓
[执行循环]
    ├── 选择工具
    ├── 执行操作
    ├── 观察结果
    └── 调整计划
    ↓
[汇总结果] → 返回给用户

工具系统

工具 功能 使用场景
浏览器 网页浏览、搜索、截图 信息收集、网页操作
代码执行 运行 Python/JS 代码 数据分析、计算任务
文件操作 读写文件 文档处理、代码生成
搜索 网页搜索 信息检索
终端 执行 shell 命令 系统操作

使用示例

示例 1:信息研究

研究 2026 年最流行的 5 个 AI Agent 框架,
对比它们的特点和适用场景,生成一份报告。

OpenManus 会:

  1. 搜索相关信息
  2. 整理和对比
  3. 生成 Markdown 报告
  4. 保存到文件

示例 2:数据分析

读取 sales.csv 文件,
分析 2025 年 Q4 的销售趋势,
生成可视化图表和分析报告。

OpenManus 会:

  1. 读取 CSV 文件
  2. 用 Python 分析数据
  3. 生成 matplotlib 图表
  4. 输出分析报告

示例 3:代码生成

创建一个 FastAPI 项目,
包含用户 CRUD 接口,
使用 SQLite 数据库,
写好单元测试。

OpenManus 会:

  1. 设计项目结构
  2. 生成代码文件
  3. 编写测试
  4. 运行测试验证

自定义扩展

添加自定义工具

from openmanus.tools import BaseTool

class DatabaseQueryTool(BaseTool):
    name = "database_query"
    description = "查询 PostgreSQL 数据库"

    def run(self, sql: str) -> str:
        import psycopg2
        conn = psycopg2.connect(self.config["db_url"])
        cursor = cursor.execute(sql)
        result = cursor.fetchall()
        conn.close()
        return str(result)

修改规划提示

config.yaml 中自定义 Agent 的行为:

agent:
  system_prompt: |
    你是一个专业的数据分析 Agent。
    在执行任何操作前,先用 Plan 模式制定计划。
    数据操作要保守,优先读取而非修改。

与其他框架对比

特性 OpenManus Claude Code MetaGPT
定位 通用 Agent 编程 Agent 软件开发团队
交互方式 对话 终端/IDE 对话
工具系统 内置 Skills/MCP 内置
多 Agent 单 Agent 多 Agent Teams 多角色
开源 CLI 部分
上手难度

注意事项

  1. API 成本:复杂任务可能消耗大量 Token,注意成本控制
  2. 安全性:代码执行在沙盒中运行,但仍需注意
  3. 稳定性:作为新兴项目,可能存在边界情况
  4. 模型依赖:效果取决于底层 LLM 的能力

相关链接

常见问题

OpenManus:开源通用 Agent 实战 适合什么读者?

OpenManus:开源通用 Agent 实战 适合希望系统掌握 Agent 框架实战 的读者,尤其是需要从概念快速过渡到实践的人。页面包含主题摘要、相关阅读和来源链接,便于形成可执行的学习路径。

阅读 OpenManus:开源通用 Agent 实战 需要多久?

当前页面预估阅读时长约 4 分钟。建议先读正文结论,再根据“同专题延伸”继续阅读,通常 20 到 40 分钟可以建立完整主题框架。

如何把 OpenManus:开源通用 Agent 实战 的内容用于实际项目?

先按正文中的关键概念完成最小可运行示例,再把示例嵌入你当前项目流程。你可以结合来源链接验证细节,并使用同专题文章补齐部署、协作和评估步骤。