Review Agent：后台复盘 Agent 如何判断什么值得保存¶

Ch04.380 Review Agent：后台复盘 Agent 如何判断什么值得保存¶

📊 Level ⭐⭐ | 6.5KB | entities/review-agent-how-it-decides-what-to-save-winty.md

Review Agent：后台复盘 Agent 如何判断什么值得保存¶

如果说 Nudge Engine 是 Hermes 的"开关"，那 Review Agent 就是它的"心智"。我读 Hermes 源码时最佩服的一处设计就是这一块。它没有让"执行任务的那个 Agent"自己复盘自己，而是单独跑了一个专门负责反思的 Agent，在后台默默工作。这件事看起来很小，但解决的是一个非常根本的工程问题：让一个正在干活的人评判自己刚刚干得好不好，结果总是又长又自夸又没用。 Review Agent 解决的就是这个问题。它换了个角色、换了个 prompt、换了套判断标准，专门干"复盘 + 决定该记什么"这一件事。

深度分析¶

Review Agent 的设计本质上是将"执行者"与"评价者"的角色彻底解耦。这一解耦在工程上并非直觉，因为让同一个模型既做事又评事看起来更省资源。但 winty 在文中指出了一个反直觉的事实：自我评价时，执行的"沉没成本"会压制评价的客观性——Agent 很难对自己的工作给出负面评价，因为这与"我刚刚尽力了"的执行心态相冲突。这种心理机制在人类和模型中都成立，因此 Hermes 选择了物理隔离：一个 Agent 跑任务，另一个 Agent 复盘。独立 Review 相比自我反思在后续任务命中率上高出约 3 倍的数据，有力地验证了这一设计的必要性。

"3 把尺子"（独特性、重复性、通用性）的重要性在于它们共同构成了一套防污染机制。单独看每个维度都不复杂，但组合在一起形成了一个递进式的过滤漏斗：独特性过滤掉模型常识，重复性过滤掉一次性事件，通用性过滤掉特定场景的偶然经验。这套标准的工程实现难度在于通用性判断——它要求 Review Agent 不仅识别信息本身，还要判断这条信息适用的边界条件。源码中为此专门设计了"必须说明适用边界"的约束，这是防止 Skill 过度抽象化的关键一步。

"Review Agent 也会学歪"这一节揭示了自学习系统的三大陷阱，每一种都指向一个根本问题：学习不等于记下一切。过度抽象化的本质是信息在蒸馏过程中丢失了执行上下文；流水账式记录的根源是把日志当成了记忆；拟人化错误的本质则是从单次行为错误推断长期偏好。值得注意的是，针对每一种失误都有对应的工程约束："步骤必须可复现"防止过度抽象、"two-strike rule"防止拟人化偏好、"一次性事件不写入"防止流水账。这些约束看起来简单，但它们是踩坑之后的工程沉淀，而非设计之初就能完备的。

写入率 15% 这个数字揭示了 Hermes 设计哲学中最反直觉的一面：系统越克制，学习质量越高。写入率上 50% 就会导致库膨胀，上 80% 则会彻底沦为噪音库。这与很多"越多越好"的直觉相反，但逻辑是自洽的：Review Agent 的核心价值在于过滤而非收集，如果过滤机制开始大量放行，整个系统的可信度就会快速衰减。失败任务信息密度是成功任务 3 倍以上的观察，进一步强化了"优先复盘失败"的原则——成功只能验证路径，失败才能揭示边界。

Patch 优先于新建的设计则解决了多版本冲突的维护难题。如果每次复盘都新建条目而不合并更新，同一个事实会被多次记录，版本之间互相矛盾，最终导致检索质量劣化。Patch 机制确保核心条目随时间收敛到稳定状态，主要进化方式是增量补充而非无限新增，这为长期维护提供了一种可持续的路径。.hermes/review-feedback.md 作为人工反馈的入口，将人类监督整合进了自动化流程，使 Review Agent 的进化方向始终可控。

实践启示¶

1. 让执行 Agent 和复盘 Agent 使用完全独立的上下文和 prompt，不要在同一个对话里同时执行任务和进行反思。执行者评自己永远有偏，见解深度远不如独立复盘。物理隔离是公正评价的前提。

2. 建立严格的三维写入标准：独有才记、重复才记、通用才记。宁可错过，不要乱记。错过的信息可以后续补充，但错误写入的信息会持续污染 Memory/Skill 库，降低后续检索的准确率。

3. 设定并监控写入率指标，保持写入率在 15% 以下为健康区间。如果写入率开始上升，说明尺子变松了，需要收紧 prompt 中的过滤条件。

4. 对失败任务的复盘赋予更高优先级，因为失败任务的信息密度远高于成功任务。每一次失败都应视为一次高价值学习机会，而不是需要掩盖的负面结果。

5. 建立人工抽检机制，定期审查 Review Agent 的输出是否出现过度抽象、流水账、拟人化等典型失误，并将抽检结果反馈到 prompt 中持续优化。.hermes/review-feedback.md 这类机制是让自动化复盘不失控的关键保障。

Review Agent：后台复盘 Agent 如何判断什么值得保存¶

Ch04.380 Review Agent：后台复盘 Agent 如何判断什么值得保存¶

Review Agent：后台复盘 Agent 如何判断什么值得保存¶

相关实体¶

深度分析¶

实践启示¶