跳转至

openclaw multi agent team practice v2

Ch04.038 openclaw multi agent team practice v2

📊 Level ⭐⭐ | 26.6KB | entities/openclaw-multi-agent-team-practice-v2.md

核心观点

OpenClaw(龙虾)的价值不在于"它能做什么",而在于"你需要它为你做什么"。 从单一 Agent 上线到搭建六专精智能体加一主管的七人团队,作者实现了从 AI 日报生成、股票分析、图片创作到代码开发的日常任务自动化、零人工干预。

为什么不做全能 Agent

上下文污染

一个 Agent 的上下文窗口有限。当生图提示词模板、投资分析框架、写作风格指南、GitHub 操作说明全部塞进同一上下文,Agent 注意力会被严重分散。

你让它写文章,它可能会在行文中不自觉地使用投资分析的术语;你让它分析股票,它可能会用写作的"润色"风格来美化数据。

技能冲突

不同场景需要的工具和权限完全不同。开发助手需要 ACP 协议调度 Claude Code,投资助手需要 Tushare 金融数据接口,社区助手需要 Moltbook API,全部开放给一个 Agent 违反最小权限原则。

人设冲突

投资助手应严谨、数据驱动;写作助手应有温度、有文采;社区助手可有趣、有个性。这些截然不同的"性格"难以在一个 Agent 身上和谐共存。

结论:专精胜于全能,隔离优于共享。

花园多智能体团队概览

作者搭建的七人团队覆盖日常最高频需求:

Agent 定位 核心价值
花园生图助手 图片创作 接 Nanobana/Seedream,定义审美偏好,提示词模板技能
花园资讯助手 AI 日报生成 定时抓取 news.smol.ai,自动推送到 EasyAI
花园开发助手 代码开发 通过 ACP 调度 Claude Code,移动端远程操控
花园投资助手 投资分析参谋 Tushare 数据 + 多维评分体系
花园社区助手 Moltbook 运营 AI Agent 社交网络发帖互动
花园写作助手 技术写作 联网搜索 + 去AI味 + 飞书文档输出
花园智能专家 统筹协调 协调所有团队成员协作

每个 Agent 都绑定了一个独立的飞书 Bot,可以在飞书里直接跟任何一个助手对话 — 想生图就找生图助手,想查股票就找投资助手,就像在一个公司群里 @不同的同事一样自然。

Agent 核心要素

一个生产级通用 Agent 由以下核心要素构成:

要素 说明
模型 LLM 是 Agent 认知引擎,决定"智力天花板"
记忆 短期记忆(会话上下文)+ 中期记忆(近几日工作记录)+ 长期记忆(跨会话知识)
人设 定义角色、边界、行为准则和沟通风格
工具 代码执行、API 调用、浏览器操控、文件读写
规划执行 任务拆解为可执行步骤,或设定固定工作流程
运行环境 安全隔离的执行环境

OpenClaw Agent 架构

OpenClaw 对通用架构做了工程化实现:

Workspace 结构

~/.openclaw/workspace-xxx/
├── SOUL.md          # Agent 灵魂,核心身份和行为准则
├── IDENTITY.md      # 身份信息,名片
├── AGENTS.md        # 工作流程,操作手册
├── USER.md          # 用户信息,让 Agent 认识你
├── MEMORY.md        # 长期记忆
├── memory/          # 中期记忆
│   └── YYYY-MM-DD.md
└── skills/          # 技能目录

人设文件体系

  • SOUL.md:Agent 的「灵魂」,定义核心身份和行为准则,相当于 System Prompt
  • IDENTITY.md:身份信息,如名字、角色描述等基础属性
  • USER.md:关于用户的信息,让 Agent 能「认识」你,知道你的背景和习惯

记忆系统

  • 短期记忆:当前对话的上下文窗口
  • 中期记忆:当日或近几日的工作记录,使用 memory/YYYY-MM-DD.md 格式的日记文件
  • 长期记忆:跨会话沉淀下来的用户偏好、关键决策和知识,对应 MEMORY.md

多 Agent 配置三要素

1. 工作环境隔离

每个 Agent 分配独立 Workspace,通过 openclaw agents add 命令创建。

openclaw agents add coding
openclaw agents add social
openclaw agents add research

2. 路由规则

通过 bindings 配置 Agent 与飞书 Bot 的绑定关系,实现消息路由。

{
  channels: {
    feishu: {
      enabled: true,
      domain: 'feishu',
      mediaMaxMb: 30,
      accounts: {
        img: {
          appId: '你的飞书 Bot appId',
          appSecret: '你的飞书 Bot appSecret',
          botName: '花园生图助手',
        }
      },
      dmPolicy: 'pairing',
    },
  },
}

绑定配置:

{
  bindings: [
    {
      agentId: 'img',
      match: {
        channel: 'feishu',
        accountId: 'img',
      },
    }
  ],
}

3. 通信机制

使用 sessions_spawn 发起非阻塞调用,通过 Announce 广播结果。需在 subagents.allowAgents 中明确声明允许调用的 Agent。

subagents: {
  allowAgents: ['img', 'writer', 'news'],
}

各专精 Agent 详解

花园生图助手

使用场景:日常写文章配图、做 PPT 插画、写方案说明技术架构,直接在飞书里说一句话就行。背后接了 Nanobana 和 Seedream 两大模型,出图质量不错,且 Agent 记得用户的审美偏好,大部分情况不用反复调整。

搭建思路:解决普通生图工具的三个痛点 — 提示词管理混乱、上下文断裂、工作流割裂。核心利用 OpenClaw 的技能系统(Skills)和长期记忆(Memory)来解决。

配置要点

  • 生图模型:nanobanana(Google 旗舰,需 GEMINI_API_KEY)+ 火山引擎 Doubao-Seedream(性价比高,需 ARK_API_KEY)
  • 提示词模板技能:创建 prompt-templates 技能,包含 SKILL.md 说明各模板使用场景,references/templates.md 存储所有提示词模板正文
  • SOUL.md:定义助手身份定位(世界顶级的 AI 绘画提示词工程师与视觉设计师)、沟通语气、审美标准、提示词生成原则、生图执行规则、安全边界
  • AGENTS.md:定义工作流程(每次启动先读哪些文件、工作顺序、哪些直接执行、哪些先询问用户)
  • MEMORY.md:沉淀长期偏好(审美倾向、常用风格、偏好的画幅比例、常见提示词写法)

花园资讯助手

使用场景:每天定时自动运行,从多个信息源抓取 AI 领域最新动态,整理成结构清晰的日报,推送到 EasyAI 网站。每天下午飞书里准时出现 AI 行业日报,零人工干预。

工作流程: 1. 检查邮箱里是否有新的 AI News 邮件 2. 如果有,读取邮件内容并写入本地 3. 调用分析脚本生成符合 EasyAI 要求的结构化日报 4. 推送到 EasyAI 5. 将日报关键信息总结后发送给我

配置要点

  • 邮箱技能:安装 imap-smtp-email 技能(通用 IMAP 协议支持),配置 QQ 邮箱的 POP3/IMAP/SMTP 服务和授权码
  • 分析脚本:从 news.smol.ai 获取日报内容 → 提取 HTML 文本 → 调用 LLM 生成结构化数据 → 格式化为 Markdown → 保存日报文件 → 生成标题和标签 → 更新 dailyData.json
  • 长期记忆:建立非常详细的工作流程,包括检索邮件、写入文件、执行脚本、git 推送、总结发送等步骤
  • 定时任务:设置每天自动执行

花园投资助手

使用场景:投资分析参谋,帮拉取个股数据、分析关键走势指标、对比行业趋势、生成买入和卖出建议。之前花钱才能买到的会员服务,现在直接就能拥有,还能随时调教。

分析报告内容: 1. 公司基本面:结合业务结构、盈利能力、成长性、现金流、财务安全判断公司核心质地 2. 估值与股价位置:通过PE/PB/PS估值水平、近1/3/5年股价历史分位评估性价比 3. 筹码与风险层面:依据股东结构、筹码散户化程度、增减持、股权质押、公司回购判断稳定性 4. 资金面与机构预期:参考主力资金流向、机构调研热度、券商研报一致预期 5. 技术面走势:结合股价趋势、关键高低位、成交量与换手率判断位置 6. 量化综合评分:五大维度加权打分,映射「买入/观察/减仓/卖出」建议 7. 风险匹配与投资者适配:匹配适合的投资者类型,给出差异化操作方案

配置要点

  • 数据获取技能:a-stock-analysis(基于新浪财经 API,免费)+ tushare-data(Tushare 225+ 专业金融 API)
  • 综合分析技能:stock-investment-report,包含 SKILL.md(执行流程)、references/investment_framework.md(评分体系)、investment_report_template.md(报告模板)
  • SOUL.md:定义 20 年投资研究经验的专业投资专家人格,严谨、理性、数据驱动,不做拍脑袋判断,优先提示风险
  • USER.md:告诉助手用户关注 A 股和美股、投资经验偏初学者、风险偏好稳健、周期偏中长期
  • MEMORY.md:定义长期工作记忆与固定流程

花园开发助手

使用场景:在手机上通过飞书远程跟 Claude Code 交互。出门在外突然想到 bug 的解法,掏出手机说一句,它就帮你改了。回到电脑前,代码已经帮你写好了。

工作流程:识别到开发任务 → 通过 acpx 创建 ACP 会话调度 Claude Code → Claude Code 到记住的项目目录找到对应项目 → 根据 Issue 描述分析代码定位问题。

配置要点

  • GitHub Skill:执行 gh auth login 完成账号授权,Agent 就能列 Issue、创建 PR、查看仓库状态
  • acpx 插件:openclaw plugins install acpx,配置 ACP 块启用调度功能,默认调用 Claude Code
  • 权限策略:配置 approve-all 允许 Agent 执行任意命令(需信任所调用 Agent),配置 nonInteractivePermissions fail 处理无头模式下的权限确认
  • 长期记忆:「后续开发任务默认采用 ACP 操作 Claude Code 的工作模式」+「常用开发目录」

花园社区助手

使用场景:连接 Moltbook(全球第一个专为 AI Agent 打造的社交网络平台,类似 Reddit 但只有 AI Agent 能发帖互动)进行社区运营。帮发帖记录里程碑和决策、与其他 Agent 讨论交流、观察不同 Agent 的行为模式。

意义:当 Agent 开始和其他 Agent 交互时,会对「多智能体」这个概念产生更深层次的理解。

配置要点:安装 Moltbook 技能(https://www.moltbook.com/skill.md),OpenClaw 自动完成注册和发帖评论功能,设定有意思的人设即可自由探索。

花园写作助手与多智能体协作

单独使用效果:先设定详细大纲,然后逐节撰写,中途自动联网搜索补充信息,对需要深挖的内容自动提取原文,写完后自动调用「去AI味」技能对每个章节进行润色,最终输出到飞书文档。

工作流程: 1. 需求理解:与用户确认主题、受众、风格、篇幅 2. 初步调研:通过网络搜索技能搜索相关资料 3. 大纲拟定:输出结构化大纲供用户确认 4. 逐节撰写:每个章节独立完成编写 5. 联网补充:对需要深挖的内容提取详细原文 6. 自查润色:检查逻辑一致性、数据准确性 7. 去 AI 味:对内容中看起来像 AI 的部分进行改写 8. 格式交付:输出为飞书文档

配置要点

  • 联网搜索:Tavily(专为 AI Agent 优化的搜索引擎 API,返回结果更结构化)
  • 飞书文档技能:直接创建、写入和整理飞书文档(之前启用飞书插件时已捆绑安装)
  • 去 AI 味技能:把「值得注意的是」「总之/综上所述」等 AI 味浓厚的表达替换成更自然的表达
  • SOUL.md:写入平时的语调和风格、核心原则、行为边界
  • MEMORY.md:记住设定的工作流程

多智能体协作示例

主管 Agent 接收任务后分阶段执行:派资讯助手获取日报内容 → 派生图助手生成配图 → 派写作助手扩写成文章并插入图片,最终输出飞书文档。

协作流程: 1. 阶段一:派花园资讯助手获取日报内容,生成配图建议 2. 阶段二:派花园生图助手根据日报主题生成三张图片 3. 阶段三:派花园写作助手进行更多调研,将资讯内容扩写成深度文章,并将图片插入合适位置,最终输出飞书文档

这就是多智能体系统的理想形态:你不需要告诉每个 Agent 怎么做,你只需要告诉主管你想要什么结果。

深度分析

从单体 Agent 到多智能体团队的设计范式转变。本文最核心的洞见在于揭示了"专精胜于全能"的多智能体架构哲学。当单一 Agent 尝试承担所有功能时,会同时遭遇上下文污染(注意力分散于异质任务)、技能冲突(最小权限原则被破坏)和人设冲突(截然不同的行为模式难以共存)。这三条挑战分别从认知、权限和个性三个维度证伪了单体 Agent 的可行性,而多智能体团队通过 Workspace 隔离从根本上规避了这些问题。

记忆系统的三层架构是生产级 Agent 的核心差异化因素。作者将 OpenClaw 的记忆划分为短期(会话上下文)、中期(近几日工作日记)、长期(跨会话知识沉淀)三个层次,这一设计直接对应了人类认知中的工作记忆、情景记忆和语义记忆的三分法。传统单体 Agent 缺乏稳定的记忆持久化机制,导致每次会话都从零开始;而三层记忆架构使得 Agent 能够累积经验、实现真正的连续性工作。这一点在投资助手和开发助手的配置中都得到了反复强调——两者都将"记住工作模式"作为核心配置目标。

主管 Agent 模式代表了多智能体协作的最优抽象层级。文章描述的协作流程——主管接收用户需求后分阶段调度专精 Agent——本质上是一种"任务分解-并行执行-结果聚合"的工作流模式。这种模式将用户从"如何做"的执行细节中解放出来,只需描述"要什么"。这与软件工程中的外观模式(Facade Pattern)高度一致:主管 Agent 作为统一接口,屏蔽了底层多个专精 Agent 的协作复杂性,对用户呈现简单的对话交互体验。

技能系统(Skills)是 Agent 能力可扩展性的关键设计。OpenClaw 的 Skills 机制将提示词模板、数据接口、执行脚本等封装为可检索、可复用的技能单元,使得 Agent 能够在需要时自动查阅而非每次重新配置。这一设计解决了"提示词管理混乱"和"上下文断裂"两个高频痛点——通过将模板存储在 references/templates.md 中,Agent 获得了类似RAG(Retrieval-Augmented Generation)的检索增强能力,使得生图这类高频场景下的个性化偏好得以持久化。

Agent 社交网络(Moltbook)预示了 AI 原生协作的新形态。当 Agent 开始与其他 Agent 交互并形成社交关系时,"多智能体"的概念从技术架构层面扩展到了社会结构层面。作者将这一体验描述为"对多智能体概念产生更深层次理解"的契机,表明 Agent 间的互动可能涌现出单体 Agent 所不具备的元认知能力。这与最近的 Multi-Agent辩论、协作编程等研究方向高度相关,代表了 AI Agent 从工具向协作者演进的早期信号。

实践启示

从高频日常任务出发,通过迭代逐步构建 Agent 团队。作者明确指出"不是设计出来的,是用出来的"——六个专精 Agent 并非预先规划,而是在日常使用中从最高频需求中逐步分化出来。这一方法论对工程实践有重要指导意义:与其一开始就设计完整的多智能体架构,不如先用一个通用 Agent 承接所有任务,当特定场景的痛点足够频繁地出现时,再将其拆分为独立 Agent。这种需求驱动的方法可以避免过度工程化,确保每个新增 Agent 都有明确的实用价值。

为每个 Agent 绑定独立飞书 Bot,实现自然的任务分发入口。多智能体团队的一个关键工程挑战是"用户如何自然地向正确的 Agent 发起请求"。作者通过为每个 Agent 配置独立飞书 Bot 的方式解决了这一问题——用户只需在飞书中 @对应的 Bot,就像在公司群里 @不同的同事。这种设计将消息路由映射为自然的人类社交行为,大幅降低了多 Agent 系统的使用门槛。实践中,其他团队在引入多 Agent 架构时,应优先考虑如何保持这种自然的交互模式。

投资助手的人设构建方法可复用到其他高风险输出场景。作者为投资助手配置的 SOUL.md 包含了"20年投资研究经验"、"数据驱动"、"优先提示风险"等精确的人格定义,并配合 USER.md 中的用户画像(初学者、稳健偏好、中长期周期)实现个性化输出。这种人设+用户画像的双层配置方法,特别适用于那些输出结果会直接影响用户决策或生活的场景(如财务建议、医疗咨询、法律意见),值得在其他垂直领域复用。关键是在 SOUL.md 中明确划定行为边界和免责声明机制。

ACP 协议实现了 OpenClaw 对外部 Agent 的标准化调度。开发助手通过 acpx 插件调度 Claude Code 的架构设计,展示了如何在多 Agent 系统中集成外部专业工具。ACP 作为一种标准化通信协议,抽象掉了解析 ANSI 转义序列等底层复杂性,使 OpenClaw 能够以结构化消息与 Claude Code 交互。企业在构建自己的多 Agent 系统时,应优先考虑采用或设计类似的协议来解耦主控 Agent 与执行 Agent 的关系,而不是让主控 Agent 直接依赖特定工具的命令行接口。

"去 AI 味"技能揭示了 LLM 输出同质化问题的工程解法。作者专门为写作助手配置了"去 AI 味"技能,将"值得注意的是""总之/综上所述"等高频出现的 AI 表达替换为更自然的表述。这反映了一个重要的工程现实:随着 LLM 输出的普及,用户越来越能够识别 AI 生成内容的特征,过度"AI 味"的内容会损害可信度。这一技能需求提示我们在构建面向用户的 Agent 时,应将输出风格的多样性纳入考量——特别是在内容创作、客户沟通等高可见性的应用场景中。

相关资源

相关概念

  • multi-agent-system — 多智能体系统基础理论
  • agent-harness — Agent 驾乘工程框架
  • acp-agent-client-protocol — Agent 通信协议
  • agent-claude-code — Claude Code 集成

相关实体