Review Agent:后台复盘 Agent 如何判断什么值得保存¶
Ch04.380 Review Agent:后台复盘 Agent 如何判断什么值得保存¶
📊 Level ⭐⭐ | 6.5KB |
entities/review-agent-how-it-decides-what-to-save-winty.md
Review Agent:后台复盘 Agent 如何判断什么值得保存¶
如果说 Nudge Engine 是 Hermes 的"开关",那 Review Agent 就是它的"心智"。 我读 Hermes 源码时最佩服的一处设计就是这一块。它没有让"执行任务的那个 Agent"自己复盘自己,而是单独跑了一个专门负责反思的 Agent,在后台默默工作。 这件事看起来很小,但解决的是一个非常根本的工程问题:让一个正在干活的人评判自己刚刚干得好不好,结果总是又长又自夸又没用。 Review Agent 解决的就是这个问题。它换了个角色、换了个 prompt、换了套判断标准,专门干"复盘 + 决定该记什么"这一件事。
相关实体¶
- Skills Registry 公测开启为企业打造私有的 Skill 管理中心
- Tencent Vibe Coding To Agentic Engineering Backend
- Claude Code Search Architecture Tencent 2026
- Openclaw Prompt Context Harness
- Harness Engineering Framework
→ 原文存档
深度分析¶
Review Agent 的设计本质上是将"执行者"与"评价者"的角色彻底解耦。这一解耦在工程上并非直觉,因为让同一个模型既做事又评事看起来更省资源。但 winty 在文中指出了一个反直觉的事实:自我评价时,执行的"沉没成本"会压制评价的客观性——Agent 很难对自己的工作给出负面评价,因为这与"我刚刚尽力了"的执行心态相冲突 。这种心理机制在人类和模型中都成立,因此 Hermes 选择了物理隔离:一个 Agent 跑任务,另一个 Agent 复盘。独立 Review 相比自我反思在后续任务命中率上高出约 3 倍的数据,有力地验证了这一设计的必要性 。
"3 把尺子"(独特性、重复性、通用性)的重要性在于它们共同构成了一套防污染机制。单独看每个维度都不复杂,但组合在一起形成了一个递进式的过滤漏斗:独特性过滤掉模型常识,重复性过滤掉一次性事件,通用性过滤掉特定场景的偶然经验 。这套标准的工程实现难度在于通用性判断——它要求 Review Agent 不仅识别信息本身,还要判断这条信息适用的边界条件。源码中为此专门设计了"必须说明适用边界"的约束,这是防止 Skill 过度抽象化的关键一步 。
"Review Agent 也会学歪"这一节揭示了自学习系统的三大陷阱,每一种都指向一个根本问题:学习不等于记下一切。过度抽象化的本质是信息在蒸馏过程中丢失了执行上下文;流水账式记录的根源是把日志当成了记忆;拟人化错误的本质则是从单次行为错误推断长期偏好 。值得注意的是,针对每一种失误都有对应的工程约束:"步骤必须可复现"防止过度抽象、"two-strike rule"防止拟人化偏好、"一次性事件不写入"防止流水账。这些约束看起来简单,但它们是踩坑之后的工程沉淀,而非设计之初就能完备的 。
写入率 15% 这个数字揭示了 Hermes 设计哲学中最反直觉的一面:系统越克制,学习质量越高。写入率上 50% 就会导致库膨胀,上 80% 则会彻底沦为噪音库 。这与很多"越多越好"的直觉相反,但逻辑是自洽的:Review Agent 的核心价值在于过滤而非收集,如果过滤机制开始大量放行,整个系统的可信度就会快速衰减。失败任务信息密度是成功任务 3 倍以上的观察,进一步强化了"优先复盘失败"的原则——成功只能验证路径,失败才能揭示边界 。
Patch 优先于新建的设计则解决了多版本冲突的维护难题。如果每次复盘都新建条目而不合并更新,同一个事实会被多次记录,版本之间互相矛盾,最终导致检索质量劣化 。Patch 机制确保核心条目随时间收敛到稳定状态,主要进化方式是增量补充而非无限新增,这为长期维护提供了一种可持续的路径。.hermes/review-feedback.md 作为人工反馈的入口,将人类监督整合进了自动化流程,使 Review Agent 的进化方向始终可控 。
实践启示¶
1. 让执行 Agent 和复盘 Agent 使用完全独立的上下文和 prompt,不要在同一个对话里同时执行任务和进行反思。执行者评自己永远有偏,见解深度远不如独立复盘。物理隔离是公正评价的前提 。
2. 建立严格的三维写入标准:独有才记、重复才记、通用才记。宁可错过,不要乱记。错过的信息可以后续补充,但错误写入的信息会持续污染 Memory/Skill 库,降低后续检索的准确率 。
3. 设定并监控写入率指标,保持写入率在 15% 以下为健康区间。如果写入率开始上升,说明尺子变松了,需要收紧 prompt 中的过滤条件 。
4. 对失败任务的复盘赋予更高优先级,因为失败任务的信息密度远高于成功任务。每一次失败都应视为一次高价值学习机会,而不是需要掩盖的负面结果 。
5. 建立人工抽检机制,定期审查 Review Agent 的输出是否出现过度抽象、流水账、拟人化等典型失误,并将抽检结果反馈到 prompt 中持续优化。.hermes/review-feedback.md 这类机制是让自动化复盘不失控的关键保障 。