跳转至

Hermes Agent 满配 12 层配置完整指南(从裸装到 24h Agent 团队)

Ch07.007 Hermes Agent 满配 12 层配置完整指南(从裸装到 24h Agent 团队)

📊 Level ⭐⭐ | 21.5KB | entities/hermes-agent-12-layer-full-configuration-guide.md

Hermes Agent 满配 12 层配置完整指南

核心定位:满配 ≠ 装满

"很多人理解的满配,是装尽可能多的插件、接尽可能多的 MCP、开尽可能多的工具、配尽可能复杂的多 Agent,让它看起来像一个很酷的 AI 控制台。"

但真正用一段时间后,这种满配很容易变成另一种负担: - 工具太多,Agent 不知道什么时候该用 - Skill 太多,选择成本变高 - Memory 太乱,长期偏好被临时信息污染 - MCP 太多,Token 和权限风险都变大 - Profile 太多,自己都不知道哪个 Agent 记住了什么 - Gateway 开了,但安全边界没想清楚 - Cron 跑了,但它到底做了什么你看不见

真正的满配定义

"围绕你的真实工作模式,把输入、记忆、技能、工具、自动化、可视化、Token 成本和多 Agent 协同这些能力,组合成一个可长期维护、可持续进化的个人 Agent 系统。"

相关实体

全文 20 章 + 4 部分结构

部分 章节 主题
第一部分:系统总览和基础 1-4 章 满配定义 + 安装 + 模型 + 输入系统 + Memory
第二部分:能力模块逐个上手 5-12 章 Skills → Tools → MCP → Gateway → Cron → Token 优化 → 可视化 → 语音/网页/搜索
第三部分:多实例与多 Agent 13-16 章 Profile 多实例 → 24h Agent 团队 → 生态导航 → 推荐满配路线
第四部分:完整实战 17-18 章 AI 工具雷达 Agent + 头脑风暴聊天室 Agent(完整闭环)
总结 19-20 章 满配清单 + 总结

12 层配置清单(核心框架)

层级 模块 解决的问题 推荐程度
L1 安装与模型 Provider 先让 Hermes 稳定跑起来 必配
L2 输入系统:SOUL.md / AGENTS.md / CLAUDE.md 让 Hermes 理解你和当前项目 必配
L3 Memory 长期记忆 跨会话记住偏好、目标、环境和经验 必配
L4 Skills 技能系统 把稳定流程沉淀成可复用能力 必配
L5 Tools / Toolsets 控制 Hermes 能调用哪些本地能力 必配
L6 MCP 外部工具连接 接 GitHub / 文件系统 / 搜索 / 数据库 / 浏览器 进阶必配
L7 Gateway 消息入口 让 Hermes 出现在 Telegram / 飞书 / Discord / 邮件 按需配置
L8 Cron 自动化 定时做日报 / 雷达 / 巡检 / 周报 强烈推荐
L9 Profiles 多实例隔离 为不同场景创建独立 Agent 强烈推荐
L10 可视化与可观测 看见它做了什么 / 哪里失败 / 花了多少 Token 进阶必配
L11 Token 精简与上下文管理 降成本 / 提速度 / 减少上下文污染 进阶必配
L12 多 Agent / 24h Agent 团队 让多个角色长期协作 高阶玩法

12 层不是让你一天全部装完,而是给你一张路线图。

推荐路径

"先跑通 → 再记住你 → 再沉淀技能 → 再接工具 → 再定时运行 → 再多入口触达 → 最后再多 Agent 协同。"

反模式警告

"不要一开始就搭 24h Agent 团队。那样很酷,但如果基础的 Memory、Skill、MCP、权限和可观测都没做好,最后只是制造一个更复杂的失控系统。"

L1 安装基线:先保证 Hermes 本体稳定

新手最容易犯的错

很多人安装 Hermes 后,第一件事就是搜资源:

hermes plugins install xxx
hermes skills install xxx
hermes gateway setup
hermes cron create ...

但官方 Quickstart 里有一个非常重要的原则

"如果 Hermes 连一个普通聊天都不能稳定完成,就不要继续叠加 Gateway、Cron、Skills、Voice 或 Routing。满配的第一步不是满配,而是'干净可用'。"

两种安装方式: - 方式 A(PyPI):追求稳定 → pip install hermes-agent + hermes setup - 方式 B(官方脚本):接近主分支 → curl -fsSL .../install.sh | bash

常用排查命令

hermes doctor
hermes model
hermes setup
hermes config show
hermes sessions list
hermes --continue

核心金句

"满配前先学会回到'已知可用状态'。否则后面装得越多,越不知道哪里坏了。"

L2 输入系统:6 层协议栈(核心创新)

Hermes 的输入系统像一个分层协议栈,每个文件解决一个层面的问题

┌─────────────────────────────────────────────┐
│ 当前对话 (临时任务/一次性要求/当前上下文)         │
├─────────────────────────────────────────────┤
│ SKILL.md (可复用任务流程)                       │
├─────────────────────────────────────────────┤
│ AGENTS.md / .hermes.md (当前目录的规则)        │
├─────────────────────────────────────────────┤
│ MEMORY.md (~2200 字符, Agent 工作笔记)         │
├─────────────────────────────────────────────┤
│ USER.md (~1375 字符, 用户画像和偏好)            │
├─────────────────────────────────────────────┤
│ SOUL.md (Agent 应该怎么工作: 立场/职责/边界)    │
└─────────────────────────────────────────────┘

每层的精确定位

文件 解决的问题 关键特征
SOUL.md 这个 Agent 应该怎么工作(立场 / 职责 / 边界 / 风格) 不是"人设卡"而是"工作协议"
USER.md 我是谁 / 我喜欢什么 / 我讨厌什么(用户画像) 长期稳定,~1375 字符
MEMORY.md 我在做什么项目 / 环境事实 / 踩坑经验 Agent 工作笔记,~2200 字符
AGENTS.md / .hermes.md 当前目录的规则 / 代码规范 / 目录说明 / 运行方式 项目级
SKILL.md 可复用任务流程(周报生成 / 访客画像抽取 / 工具分析) 流程级
当前对话 临时任务 / 一次性要求 / 当前上下文 一次性

重要机制

"Hermes 内置记忆由两个文件组成:MEMORY.md(约 2200 字符)偏 Agent 的工作笔记,USER.md(约 1375 字符)偏你的画像和偏好。它们会在每次 session 开始时作为快照注入 system prompt;会话中写入的新记忆一般要到下次 session 才真正生效。"

3.1 SOUL.md:不要写玄学人格,要写工作协议

反面教材

你是一个聪明、强大、无所不能的 AI 助手。
问题:没有给 Agent 任何可以执行的规则。Agent 不知道什么时候该主动 / 什么时候该刹车 / 什么时候可以不同意你。

SOUL.md 应该回答的不是"你是什么性格",而是"你应该怎么和我协作"

5 大核心模块

  1. 立场:保持直接、务实、有判断力、高主动性;"有用比顺耳重要。锋利比润色重要。诚实比显得厉害重要";说重点,然后停止
  2. 职责:不要等待完美指令;主动发现机会、指出问题、识别停滞循环;你的职责是制造推进,不是生产一堆最后进坟场的材料
  3. 自主性边界:硬边界(公开发布 / 购买 / 发送消息 / 删除 / 暴露隐私 — 没有明确批准绝不能执行);其他情况下"如果你对判断有信心,就推进"
  4. 反对与纠偏:可以直接不同意但需要先赢得反对的资格(数据 / 例子 / 推理 / 更好的替代方案);"不要为了保护我的自尊而隐瞒有用的真相"
  5. 沟通风格:任务简单时简短 / 复杂时结构化 / 有风险时明确写出权衡;避免企业黑话、虚假兴奋;面向公众内容"应该像一个真实的人写出来的:有品味、有伤痕、有观点"
  6. 自我改进当某个工作流重复出现时,考虑它是否应该变成检查清单、模板、脚本或可复用 Skill;"不要让重复摩擦保持隐形"

核心断言

"SOUL.md 是 Agent 的'工作协议',不是人设卡。好的 SOUL.md 不是让 Agent 听起来更像人,而是让它做事更像一个靠谱的搭档。"

3.2 USER.md vs MEMORY.md 核心区分

"USER.md 写'我是谁',MEMORY.md 写'我在做什么'。"

维度 USER.md MEMORY.md
定位 你的长期画像 Agent 的工作笔记
容量 ~1375 字符 ~2200 字符
适合写 身份、偏好、沟通风格、期望 项目、环境、踩坑、工作流、决策原则

USER.md 模板: - Profile(职业身份 / 技术背景 / 当前最关注的 3 个方向) - Communication Preferences(语言 / 简短 vs 结构化 / 是否接受反驳 / 讨厌什么类型) - Output Preferences(技术方案 / 业务方案 / 写作任务 各要包含什么) - Collaboration Style(是否多想法切换 / 是否需要聚焦提醒 / 看重真实判断还是情绪安慰)

MEMORY.md 模板: - Active Context(当前长期探索方向 / 当前重点不是什么) - Current Priorities(1-3 件事 + 目标) - Active Projects(目标 / 当前进展 / 最大阻塞 / 下一步) - Decision Principles(拆问题框架 / Agent 任务框架 / 工程任务规则) - Known Pitfalls(不要把临时想法写成长期承诺 / 不要在没有验证时编造命令 / 不要让项目无限发散) - Environment Notes(常用本地工具 / 环境特殊性) - Memory Maintenance Rules(只保存长期稳定信息 / 过期项目不要长期保留 / 优先压缩成原则 / 纠正时更新对应条目而不是重复追加)

3.3 记忆初始化:让 Hermes 通过访谈帮你写

核心方法:直接让 Hermes 通过访谈帮你生成 User.md + Memory.md,而不是手动填模板

"一个实用的做法是:直接让 Hermes 通过访谈帮你生成。"

4 阶段路线图(核心方法论)

推荐路径: 1. 先跑通(L1 安装 + 干净可用) 2. 再记住你(L2 输入系统 + L3 Memory) 3. 再沉淀技能(L4 Skills) 4. 再接工具(L5 Tools + L6 MCP) 5. 再定时运行(L8 Cron) 6. 再多入口触达(L7 Gateway) 7. 最后再多 Agent 协同(L9 Profile + L12 多 Agent)

与已有实体的关系

  • Hermes 9 Module Architecture (5-12) — 9 模块系统架构
  • Hermes 9 Module Architecture Winty (5-21) — winty 的 9 模块版本
  • 本实体 = 12 层满配配置指南与 9 模块架构不同视角 — 9 模块 = 内部组件 / 12 层 = 外部配置)

  • Hermes Agent Getting Started Guide 2026 — 入门指南(专注 L1)

  • 本实体 = 入门 → 满配的完整路径

  • Mac Multi Agent Coding Skills Hooks Harness — MAC = Skills + Hooks 两层

  • 本实体 L4 Skills + 本实体 L6 MCP = 更广义的工具/MCP 组合
  • MAC 是 Skills+Hooks 编程模型Hermes 12 层是产品级配置模型

  • Hermes Agent Skill Crossover Optimization — Skill 互优化

  • 本实体 L4 Skills 提到"把稳定流程沉淀成可复用能力" — 与互优化形成生态互补

核心金句

  • "满配的第一步不是满配,而是'干净可用'"
  • "如果 Hermes 连一个普通聊天都不能稳定完成,就不要继续叠加 Gateway、Cron、Skills、Voice 或 Routing"
  • "满配前先学会回到'已知可用状态'。否则后面装得越多,越不知道哪里坏了"
  • "输入系统像一个分层协议栈,每个文件解决一个层面的问题"
  • "SOUL.md 应该回答的不是'你是什么性格',而是'你应该怎么和我协作'"
  • "SOUL.md 是 Agent 的'工作协议',不是人设卡"
  • "有用比顺耳重要。锋利比润色重要。诚实比显得厉害重要"
  • "你的职责不是生产一堆最后进坟场的材料。你的职责是制造推进"
  • "不要为了保护我的自尊而隐瞒有用的真相"
  • "面向公众的内容应该像一个真实的人写出来的:有品味、有伤痕、有观点"
  • "不要让重复摩擦保持隐形"
  • "USER.md 写'我是谁',MEMORY.md 写'我在做什么'"
  • "先跑通 → 再记住你 → 再沉淀技能 → 再接工具 → 再定时运行 → 再多入口触达 → 最后再多 Agent 协同"
  • "不要一开始就搭 24h Agent 团队。那样很酷,但如果基础的 Memory、Skill、MCP、权限和可观测都没做好,最后只是制造一个更复杂的失控系统"

深度分析

  • 12 层配置的本质是"能力叠加路线图"而非功能清单。该指南最核心的价值在于它提供的不是功能描述,而是一套优先级框架——从 L1 到 L12 的递进路径隐含了一个关键洞察:个人 Agent 系统的失败往往不是因为"装得不够多",而是因为"基础不扎实时就叠加新能力"。这与软件工程中"先保证主干稳定,再叠加功能"的经典原则一脉相承。

  • 6 层输入协议栈(SOUL→USER→MEMORY→AGENTS→SKILL→对话)是该系统最独特的设计创新。它将 Agent 的输入按时间稳定性分层:SOUL.md 最稳定(定义工作方式)、USER.md 次稳定(用户画像)、MEMORY.md 动态变化(项目状态)、SKILL.md 流程级、对话最临时。这种分层设计解决了大多数 Agent 系统的核心痛点——短期上下文污染长期偏好。传统 Agent 把所有信息平铺在 context 里,而该协议栈通过文件边界强制实现了关注点分离。

  • SOUL.md 作为"工作协议"而非"人设卡"的重新定位,直接回应了 Agent 配置领域的典型误区。大量用户在配置 Agent 时倾向于写"你是一个友善的助手"这类模糊描述,这导致 Agent 行为不可预测。该指南将 SOUL.md 的定位收窄为"工作协议"——明确回答"你应该怎么和我协作"而非"你是什么性格",这是一个务实且可操作的范式转变。

  • Cron + Profile 的组合是实现真正"24h Agent 团队"的最小可行路径。L8 Cron 负责定时任务自动化,L9 Profile 负责场景隔离,两者结合可以在单一 Hermes 实例上模拟多角色协作。相比直接搭建 L12 多 Agent 系统,Cron+Profile 的组合风险更低、配置更轻,是普通用户向多 Agent 过渡的最优中间态。

  • "反模式警告"(不要一开始就搭 24h Agent 团队)是全文最具有实践智慧的一句话。它揭示了一个常见的 Agent 配置心理陷阱:用技术复杂度替代实际价值评估。多 Agent 系统在视觉上很酷,在架构上也很有说服力,但如果基础层(Memory、Skill、MCP、权限、可观测)没做好,多 Agent 只是放大了混乱的规模而非解决问题的能力。

实践启示

  • 从 L1→L4 开始,先跑通再记住最后才沉淀技能。具体操作:先用 hermes doctor 确认基础安装无问题;然后通过访谈让 Agent 生成 USER.md 和 MEMORY.md(不要手动填模板);再配置 SOUL.md 时聚焦"工作协议"而非"人设";最后才考虑 Skills 沉淀。这个顺序不能颠倒。

  • 为不同 Profile 配置不同的 SOUL.md,避免一个 Agent 试图满足所有场景。比如"研究 Profile"的 SOUL.md 应该强调信息整合和引用准确性,"执行 Profile"的 SOUL.md 应该强调工具调用的确定性和步骤化执行。Profile 间的隔离不仅是 Memory 的隔离,应该是工作协议的隔离。

  • Cron 任务优先选择"高频率、低风险、可验证"的场景。日报生成、雷达巡检这类定时任务是最容易验证效果的选择,因为输出结果有明确标准且失败影响可控。避免在一开始就配置"每天自动发送 10 封邮件"这类高风险 Cron 任务——一旦出错,Agent 的信任成本会非常高。

  • 使用 MemOS/memos-hermes-plugin 解决原生记忆的"记住但记得乱"问题。该插件通过 LLM 判断去重(而非文本相似度)实现记忆库智能清理,并通过混合检索(关键词+语义)提升记忆召回率。对于长期高频使用 Hermes 的用户,这是 L3 Memory 层最重要的进阶配置 Memos Hermes Plugin

  • 多 Agent 协作的起点是"研究与执行分离",而非功能分工。根据 Hermes Four Agents Setup 的经验,多 Agent 架构的有效分工是按任务类型(研究 vs 执行)而非按功能模块(写代码 vs 写文档)。研究 Agent 需要长上下文和信息整合能力,执行 Agent 需要工具调用可靠性和步骤化执行能力,两者对模型能力的要求本质不同,混在一起会互相拖累。