Hermes Agent 满配 12 层配置完整指南(从裸装到 24h Agent 团队)¶
Ch07.007 Hermes Agent 满配 12 层配置完整指南(从裸装到 24h Agent 团队)¶
📊 Level ⭐⭐ | 21.5KB |
entities/hermes-agent-12-layer-full-configuration-guide.md
Hermes Agent 满配 12 层配置完整指南¶
核心定位:满配 ≠ 装满¶
"很多人理解的满配,是装尽可能多的插件、接尽可能多的 MCP、开尽可能多的工具、配尽可能复杂的多 Agent,让它看起来像一个很酷的 AI 控制台。"
但真正用一段时间后,这种满配很容易变成另一种负担: - 工具太多,Agent 不知道什么时候该用 - Skill 太多,选择成本变高 - Memory 太乱,长期偏好被临时信息污染 - MCP 太多,Token 和权限风险都变大 - Profile 太多,自己都不知道哪个 Agent 记住了什么 - Gateway 开了,但安全边界没想清楚 - Cron 跑了,但它到底做了什么你看不见
真正的满配定义:
"围绕你的真实工作模式,把输入、记忆、技能、工具、自动化、可视化、Token 成本和多 Agent 协同这些能力,组合成一个可长期维护、可持续进化的个人 Agent 系统。"
相关实体¶
全文 20 章 + 4 部分结构¶
| 部分 | 章节 | 主题 |
|---|---|---|
| 第一部分:系统总览和基础 | 1-4 章 | 满配定义 + 安装 + 模型 + 输入系统 + Memory |
| 第二部分:能力模块逐个上手 | 5-12 章 | Skills → Tools → MCP → Gateway → Cron → Token 优化 → 可视化 → 语音/网页/搜索 |
| 第三部分:多实例与多 Agent | 13-16 章 | Profile 多实例 → 24h Agent 团队 → 生态导航 → 推荐满配路线 |
| 第四部分:完整实战 | 17-18 章 | AI 工具雷达 Agent + 头脑风暴聊天室 Agent(完整闭环) |
| 总结 | 19-20 章 | 满配清单 + 总结 |
12 层配置清单(核心框架)¶
| 层级 | 模块 | 解决的问题 | 推荐程度 |
|---|---|---|---|
| L1 | 安装与模型 Provider | 先让 Hermes 稳定跑起来 | 必配 |
| L2 | 输入系统:SOUL.md / AGENTS.md / CLAUDE.md | 让 Hermes 理解你和当前项目 | 必配 |
| L3 | Memory 长期记忆 | 跨会话记住偏好、目标、环境和经验 | 必配 |
| L4 | Skills 技能系统 | 把稳定流程沉淀成可复用能力 | 必配 |
| L5 | Tools / Toolsets | 控制 Hermes 能调用哪些本地能力 | 必配 |
| L6 | MCP 外部工具连接 | 接 GitHub / 文件系统 / 搜索 / 数据库 / 浏览器 | 进阶必配 |
| L7 | Gateway 消息入口 | 让 Hermes 出现在 Telegram / 飞书 / Discord / 邮件 | 按需配置 |
| L8 | Cron 自动化 | 定时做日报 / 雷达 / 巡检 / 周报 | 强烈推荐 |
| L9 | Profiles 多实例隔离 | 为不同场景创建独立 Agent | 强烈推荐 |
| L10 | 可视化与可观测 | 看见它做了什么 / 哪里失败 / 花了多少 Token | 进阶必配 |
| L11 | Token 精简与上下文管理 | 降成本 / 提速度 / 减少上下文污染 | 进阶必配 |
| L12 | 多 Agent / 24h Agent 团队 | 让多个角色长期协作 | 高阶玩法 |
12 层不是让你一天全部装完,而是给你一张路线图。
推荐路径:
"先跑通 → 再记住你 → 再沉淀技能 → 再接工具 → 再定时运行 → 再多入口触达 → 最后再多 Agent 协同。"
反模式警告:
"不要一开始就搭 24h Agent 团队。那样很酷,但如果基础的 Memory、Skill、MCP、权限和可观测都没做好,最后只是制造一个更复杂的失控系统。"
L1 安装基线:先保证 Hermes 本体稳定¶
新手最容易犯的错:
很多人安装 Hermes 后,第一件事就是搜资源:
但官方 Quickstart 里有一个非常重要的原则:
"如果 Hermes 连一个普通聊天都不能稳定完成,就不要继续叠加 Gateway、Cron、Skills、Voice 或 Routing。满配的第一步不是满配,而是'干净可用'。"
两种安装方式: - 方式 A(PyPI):追求稳定 → pip install hermes-agent + hermes setup - 方式 B(官方脚本):接近主分支 → curl -fsSL .../install.sh | bash
常用排查命令:
核心金句:
"满配前先学会回到'已知可用状态'。否则后面装得越多,越不知道哪里坏了。"
L2 输入系统:6 层协议栈(核心创新)¶
Hermes 的输入系统像一个分层协议栈,每个文件解决一个层面的问题:
┌─────────────────────────────────────────────┐
│ 当前对话 (临时任务/一次性要求/当前上下文) │
├─────────────────────────────────────────────┤
│ SKILL.md (可复用任务流程) │
├─────────────────────────────────────────────┤
│ AGENTS.md / .hermes.md (当前目录的规则) │
├─────────────────────────────────────────────┤
│ MEMORY.md (~2200 字符, Agent 工作笔记) │
├─────────────────────────────────────────────┤
│ USER.md (~1375 字符, 用户画像和偏好) │
├─────────────────────────────────────────────┤
│ SOUL.md (Agent 应该怎么工作: 立场/职责/边界) │
└─────────────────────────────────────────────┘
每层的精确定位:
| 文件 | 解决的问题 | 关键特征 |
|---|---|---|
| SOUL.md | 这个 Agent 应该怎么工作(立场 / 职责 / 边界 / 风格) | 不是"人设卡"而是"工作协议" |
| USER.md | 我是谁 / 我喜欢什么 / 我讨厌什么(用户画像) | 长期稳定,~1375 字符 |
| MEMORY.md | 我在做什么项目 / 环境事实 / 踩坑经验 | Agent 工作笔记,~2200 字符 |
| AGENTS.md / .hermes.md | 当前目录的规则 / 代码规范 / 目录说明 / 运行方式 | 项目级 |
| SKILL.md | 可复用任务流程(周报生成 / 访客画像抽取 / 工具分析) | 流程级 |
| 当前对话 | 临时任务 / 一次性要求 / 当前上下文 | 一次性 |
重要机制:
"Hermes 内置记忆由两个文件组成:MEMORY.md(约 2200 字符)偏 Agent 的工作笔记,USER.md(约 1375 字符)偏你的画像和偏好。它们会在每次 session 开始时作为快照注入 system prompt;会话中写入的新记忆一般要到下次 session 才真正生效。"
3.1 SOUL.md:不要写玄学人格,要写工作协议¶
反面教材:
问题:没有给 Agent 任何可以执行的规则。Agent 不知道什么时候该主动 / 什么时候该刹车 / 什么时候可以不同意你。SOUL.md 应该回答的不是"你是什么性格",而是"你应该怎么和我协作"
5 大核心模块:
- 立场:保持直接、务实、有判断力、高主动性;"有用比顺耳重要。锋利比润色重要。诚实比显得厉害重要";说重点,然后停止
- 职责:不要等待完美指令;主动发现机会、指出问题、识别停滞循环;你的职责是制造推进,不是生产一堆最后进坟场的材料
- 自主性边界:硬边界(公开发布 / 购买 / 发送消息 / 删除 / 暴露隐私 — 没有明确批准绝不能执行);其他情况下"如果你对判断有信心,就推进"
- 反对与纠偏:可以直接不同意但需要先赢得反对的资格(数据 / 例子 / 推理 / 更好的替代方案);"不要为了保护我的自尊而隐瞒有用的真相"
- 沟通风格:任务简单时简短 / 复杂时结构化 / 有风险时明确写出权衡;避免企业黑话、虚假兴奋;面向公众内容"应该像一个真实的人写出来的:有品味、有伤痕、有观点"
- 自我改进:当某个工作流重复出现时,考虑它是否应该变成检查清单、模板、脚本或可复用 Skill;"不要让重复摩擦保持隐形"
核心断言:
"SOUL.md 是 Agent 的'工作协议',不是人设卡。好的 SOUL.md 不是让 Agent 听起来更像人,而是让它做事更像一个靠谱的搭档。"
3.2 USER.md vs MEMORY.md 核心区分¶
"USER.md 写'我是谁',MEMORY.md 写'我在做什么'。"
| 维度 | USER.md | MEMORY.md |
|---|---|---|
| 定位 | 你的长期画像 | Agent 的工作笔记 |
| 容量 | ~1375 字符 | ~2200 字符 |
| 适合写 | 身份、偏好、沟通风格、期望 | 项目、环境、踩坑、工作流、决策原则 |
USER.md 模板: - Profile(职业身份 / 技术背景 / 当前最关注的 3 个方向) - Communication Preferences(语言 / 简短 vs 结构化 / 是否接受反驳 / 讨厌什么类型) - Output Preferences(技术方案 / 业务方案 / 写作任务 各要包含什么) - Collaboration Style(是否多想法切换 / 是否需要聚焦提醒 / 看重真实判断还是情绪安慰)
MEMORY.md 模板: - Active Context(当前长期探索方向 / 当前重点不是什么) - Current Priorities(1-3 件事 + 目标) - Active Projects(目标 / 当前进展 / 最大阻塞 / 下一步) - Decision Principles(拆问题框架 / Agent 任务框架 / 工程任务规则) - Known Pitfalls(不要把临时想法写成长期承诺 / 不要在没有验证时编造命令 / 不要让项目无限发散) - Environment Notes(常用本地工具 / 环境特殊性) - Memory Maintenance Rules(只保存长期稳定信息 / 过期项目不要长期保留 / 优先压缩成原则 / 纠正时更新对应条目而不是重复追加)
3.3 记忆初始化:让 Hermes 通过访谈帮你写¶
核心方法:直接让 Hermes 通过访谈帮你生成 User.md + Memory.md,而不是手动填模板
"一个实用的做法是:直接让 Hermes 通过访谈帮你生成。"
4 阶段路线图(核心方法论)¶
推荐路径: 1. 先跑通(L1 安装 + 干净可用) 2. 再记住你(L2 输入系统 + L3 Memory) 3. 再沉淀技能(L4 Skills) 4. 再接工具(L5 Tools + L6 MCP) 5. 再定时运行(L8 Cron) 6. 再多入口触达(L7 Gateway) 7. 最后再多 Agent 协同(L9 Profile + L12 多 Agent)
与已有实体的关系¶
Hermes 9 Module Architecture(5-12) — 9 模块系统架构Hermes 9 Module Architecture Winty(5-21) — winty 的 9 模块版本-
本实体 = 12 层满配配置指南(与 9 模块架构不同视角 — 9 模块 = 内部组件 / 12 层 = 外部配置)
-
Hermes Agent Getting Started Guide 2026— 入门指南(专注 L1) -
本实体 = 入门 → 满配的完整路径
-
Mac Multi Agent Coding Skills Hooks Harness— MAC = Skills + Hooks 两层 - 本实体 L4 Skills + 本实体 L6 MCP = 更广义的工具/MCP 组合
-
MAC 是 Skills+Hooks 编程模型;Hermes 12 层是产品级配置模型
-
Hermes Agent Skill Crossover Optimization— Skill 互优化 - 本实体 L4 Skills 提到"把稳定流程沉淀成可复用能力" — 与互优化形成生态互补
核心金句¶
- "满配的第一步不是满配,而是'干净可用'"
- "如果 Hermes 连一个普通聊天都不能稳定完成,就不要继续叠加 Gateway、Cron、Skills、Voice 或 Routing"
- "满配前先学会回到'已知可用状态'。否则后面装得越多,越不知道哪里坏了"
- "输入系统像一个分层协议栈,每个文件解决一个层面的问题"
- "SOUL.md 应该回答的不是'你是什么性格',而是'你应该怎么和我协作'"
- "SOUL.md 是 Agent 的'工作协议',不是人设卡"
- "有用比顺耳重要。锋利比润色重要。诚实比显得厉害重要"
- "你的职责不是生产一堆最后进坟场的材料。你的职责是制造推进"
- "不要为了保护我的自尊而隐瞒有用的真相"
- "面向公众的内容应该像一个真实的人写出来的:有品味、有伤痕、有观点"
- "不要让重复摩擦保持隐形"
- "USER.md 写'我是谁',MEMORY.md 写'我在做什么'"
- "先跑通 → 再记住你 → 再沉淀技能 → 再接工具 → 再定时运行 → 再多入口触达 → 最后再多 Agent 协同"
- "不要一开始就搭 24h Agent 团队。那样很酷,但如果基础的 Memory、Skill、MCP、权限和可观测都没做好,最后只是制造一个更复杂的失控系统"
深度分析¶
-
12 层配置的本质是"能力叠加路线图"而非功能清单。该指南最核心的价值在于它提供的不是功能描述,而是一套优先级框架——从 L1 到 L12 的递进路径隐含了一个关键洞察:个人 Agent 系统的失败往往不是因为"装得不够多",而是因为"基础不扎实时就叠加新能力"。这与软件工程中"先保证主干稳定,再叠加功能"的经典原则一脉相承。
-
6 层输入协议栈(SOUL→USER→MEMORY→AGENTS→SKILL→对话)是该系统最独特的设计创新。它将 Agent 的输入按时间稳定性分层:SOUL.md 最稳定(定义工作方式)、USER.md 次稳定(用户画像)、MEMORY.md 动态变化(项目状态)、SKILL.md 流程级、对话最临时。这种分层设计解决了大多数 Agent 系统的核心痛点——短期上下文污染长期偏好。传统 Agent 把所有信息平铺在 context 里,而该协议栈通过文件边界强制实现了关注点分离。
-
SOUL.md 作为"工作协议"而非"人设卡"的重新定位,直接回应了 Agent 配置领域的典型误区。大量用户在配置 Agent 时倾向于写"你是一个友善的助手"这类模糊描述,这导致 Agent 行为不可预测。该指南将 SOUL.md 的定位收窄为"工作协议"——明确回答"你应该怎么和我协作"而非"你是什么性格",这是一个务实且可操作的范式转变。
-
Cron + Profile 的组合是实现真正"24h Agent 团队"的最小可行路径。L8 Cron 负责定时任务自动化,L9 Profile 负责场景隔离,两者结合可以在单一 Hermes 实例上模拟多角色协作。相比直接搭建 L12 多 Agent 系统,Cron+Profile 的组合风险更低、配置更轻,是普通用户向多 Agent 过渡的最优中间态。
-
"反模式警告"(不要一开始就搭 24h Agent 团队)是全文最具有实践智慧的一句话。它揭示了一个常见的 Agent 配置心理陷阱:用技术复杂度替代实际价值评估。多 Agent 系统在视觉上很酷,在架构上也很有说服力,但如果基础层(Memory、Skill、MCP、权限、可观测)没做好,多 Agent 只是放大了混乱的规模而非解决问题的能力。
实践启示¶
-
从 L1→L4 开始,先跑通再记住最后才沉淀技能。具体操作:先用
hermes doctor确认基础安装无问题;然后通过访谈让 Agent 生成 USER.md 和 MEMORY.md(不要手动填模板);再配置 SOUL.md 时聚焦"工作协议"而非"人设";最后才考虑 Skills 沉淀。这个顺序不能颠倒。 -
为不同 Profile 配置不同的 SOUL.md,避免一个 Agent 试图满足所有场景。比如"研究 Profile"的 SOUL.md 应该强调信息整合和引用准确性,"执行 Profile"的 SOUL.md 应该强调工具调用的确定性和步骤化执行。Profile 间的隔离不仅是 Memory 的隔离,应该是工作协议的隔离。
-
Cron 任务优先选择"高频率、低风险、可验证"的场景。日报生成、雷达巡检这类定时任务是最容易验证效果的选择,因为输出结果有明确标准且失败影响可控。避免在一开始就配置"每天自动发送 10 封邮件"这类高风险 Cron 任务——一旦出错,Agent 的信任成本会非常高。
-
使用 MemOS/memos-hermes-plugin 解决原生记忆的"记住但记得乱"问题。该插件通过 LLM 判断去重(而非文本相似度)实现记忆库智能清理,并通过混合检索(关键词+语义)提升记忆召回率。对于长期高频使用 Hermes 的用户,这是 L3 Memory 层最重要的进阶配置 Memos Hermes Plugin。
-
多 Agent 协作的起点是"研究与执行分离",而非功能分工。根据 Hermes Four Agents Setup 的经验,多 Agent 架构的有效分工是按任务类型(研究 vs 执行)而非按功能模块(写代码 vs 写文档)。研究 Agent 需要长上下文和信息整合能力,执行 Agent 需要工具调用可靠性和步骤化执行能力,两者对模型能力的要求本质不同,混在一起会互相拖累。