跳转至

Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践

Ch05.027 Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践

📊 Level ⭐⭐ | 16.5KB | entities/tencent-ai-team-knowledge-mgmt-harness-moat.md

Tencent Ai Team Knowledge Mgmt Harness Moat

"Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践"

Harness不是目的,知识才是护城河 —— 一个AI工程交付团队的知识沉淀实践

核心论点

"工作流只是管道,知识才是流过管道的活水。"

  • 模型/工具链/工作流会迭代重构,但团队在特定业务领域积累的领域模型、架构决策、最佳实践、已知陷阱、业务流程——这些知识是永恒的,不会因模型换代而失效。
  • Skill、Agent、工具链会随模型迭代更新,但领域知识是永恒的。

一、三大标志性 Harness 实践对比

实践方 核心关注 关键动作
OpenAI — Codex 人机交互协议 零手写代码,通过精确的指令协议驾驭 Agent
Cursor — Self-Driving 多 Agent 协同 背景 Agent 自动检测冲突并运行测试
Anthropic — Claude Code 长时运行稳定性 多层记忆系统 + CLAUDE.md 约束

二、Harness Engineering 三支柱(知识位置)

上下文工程 架构约束 持续治理
长/短期记忆、知识检索注入、渐进式披露、上下文防火墙 Agent 编排模式、状态机设计、降级策略、安全边界 质量门禁、知识生命周期自动衰减、持续进化
知识管理本身就是 Harness Engineering 的核心能力,而不是附属品。

三、核心论点:为什么知识沉淀比工作流更重要

3.1 工作流是"可替换的",知识是"可累积的"

今天用 16 阶段状态机,明天可能用 DAG 编排。但"广告预算扣减在高并发下会超扣,需用 Redis+Lua 保证原子性"——这条知识不管工作流怎么变都有价值。

3.2 没有知识沉淀的工作流是"一次性"的

团队搭了复杂的 Agent 工作流,但每次从零开始。上一次踩过的坑,下一次照踩不误。这就是没有知识闭环的工作流——投入了工程成本,却没有让工具链变得越来越聪明。

3.3 知识是团队的"复利资产"

三类知识:

  • 散点型知识:孤立的事实
  • 因果型知识:A 导致 B 的推理链
  • 时空型知识:特定场景和时间窗口下才成立的经验

四、知识分层架构:五层存储 × 五种类型 × 三级成熟度

4.1 五层存储架构

Layer 定义 说明
Layer 0-P 个人偏好 (~/.ai-team/) 纯本地,不共享(缩进风格、函数式 vs OOP)
Layer 0-T 团队约定 (team-conventions/) 团队级,Git 共享(代码规范、Commit 规范、Review 标准)
Layer 1 技术知识 (tech-wiki/) 团队级,跨项目(Spring Boot 多租户设计模式、Optional 依赖传递陷阱)
Layer 2 业务知识 (biz-wiki/{domain}/) 团队级,按领域(广告审核流程:提交→机审→人审→上线)
Layer 3 项目知识 (docs/knowledge/) 项目级(当前项目数据库版本等)
知识可以"向上提升":Layer 3 的项目知识如果跨项目通用,会自动提升到 Layer 1 或 Layer 2。

4.2 五种知识类型(MECE 原则)

类型 定义 示例
model 实体定义、数据结构、关系图 "广告计划包含预算/出价/投放时段三个核心字段"
decision 技术选型、架构决策及理由 "选择事件驱动而非 RPC 同步,因为广告状态变更需要解耦"
guideline 推荐做法或禁止做法 recommend: "公共模块变更后的兼容性检查清单"
pitfall 已知风险、故障模式、排查步骤 "广告预算扣减在高并发下会超扣"
process 业务流程、状态机、操作步骤 "广告审核:提交→机审→人审→上线"

4.3 三级成熟度 + 自动衰减

draft(新提取,单一来源)
  ↓ 在 1 个工作流中被成功引用
verified(单项目验证)
  ↓ 在 ≥2 个不同项目中被验证
proven(成熟/可信赖)
自动衰减机制

  • proven 条目 12 个月未被引用 → 降级为 verified
  • verified 条目 6 个月未被引用 → 降级为 draft
  • draft 条目持续未引用 + Lint 标记 → 归档,移出活跃索引 借鉴 Karpathy LLM Wiki 的 Lint 操作:定期识别矛盾、孤儿页、缺失交叉引用和数据缺口。

五、团队知识库设计

独立 Git 仓库(知识的"单一事实来源")

team-knowledge.git
├── knowledge-catalog.md          ← Agent 查询入口
├── .knowledge-config.yaml        ← 团队配置
├── team-conventions/            ← Layer 0-T
├── tech-wiki/                   ← Layer 1
│   ├── catalog.md
│   ├── patterns/TK-PAT-001.md
│   └── anti-patterns/TK-AP-001.md
├── biz-wiki/{domain}/           ← Layer 2
│   ├── catalog.md
│   ├── entities/BK-AD-E001.md
│   └── pitfalls/BK-AD-P001.md
├── project-profiles/
└── contributions/
    ├── pending/
    └── conflicts/
独立仓库的三个理由:跨项目共享、生命周期独立(业务项目归档但知识不消失)、权限独立。

三种团队角色

角色 权限 人群
maintainer 裁决冲突、审批 proven 提升、管理成员 团队负责人、资深工程师
contributor 通过工作流自动贡献 正式团队成员
reader 只消费不贡献 新成员试用期

区块链三思想借鉴(用 Git 实现)

区块链思想 AI Team 实现 机制
不可篡改追加日志 log.md 只追加不修改 每条变更记录贡献者、时间、会话哈希
贡献可溯源 evidence.contributors[] 类似 Git blame,粒度为知识条目级
共识机制 maturity 多人验证提升 draft→verified: 1人验证;verified→proven: ≥2人 + ≥2项目

深度分析

知识工程三通道循环模型的工程深度 文章提出的三通道沉淀模型(冷启动导入 / flow-run 按需查询 / ARCHIVE 自动提取)本质上是将知识生产嵌入日常工作流的每一个阶段,而不是将知识管理当作独立流程。^ INIT 阶段自动 git pull 团队知识仓库,使新工作流在启动瞬间就站在前人肩膀上,而不是从零开始。各阶段 Agent 在决策点按需查询知识库——这个设计体现了"精准而非贪婪"的上下文使用原则:不是在开始时一股脑注入所有知识,而是让 Agent 在需要时主动发现并引用。^ ARCHIVE 阶段的 @archiver 角色自动从全流程产物中提取知识条目并执行提升判定,这意味着知识生产是工作流的自然副产品,不需要额外的知识录入负担。这是知识工程中最难也是最关键的一步——让知识生产成为工程师工作的自然结果而非额外负担。^ 三级渐进式索引的上下文经济学 Karpathy LLM Wiki Pattern 的三级渐进式索引(Layer A 全景目录 ~50行 → Layer B 分类清单 ~100-300行 → Layer C 完整条目 ~50-200行)解决了一个核心矛盾:Agent 需要足够的上下文来做出正确决策,但上下文窗口是有限的。^ 对比一次性推送 50 条完整知识(5000-10000 行),渐进查询将上下文消耗降低了一个数量级,同时保持决策质量不降。这是 RAG(检索增强生成)思想在知识管理场景的具体实现——按需检索而非全量加载。^ 知识引用追踪闭环(Agent 在输出产物中记录 knowledgeReferences,ARCHIVE 阶段批量更新 last_referenced)使得知识条目的引用次数成为 maturity 提升的客观依据,减少了主观评估的随意性,实现了知识质量的量化管理。^ ** maturity 自动衰减机制的系统性价值 proven → verified → draft → 归档的自动衰减机制解决了知识管理中最棘手的问题:知识库随时间推移会积累过时、孤立、矛盾的信息,久而久之失去可用性。^ 通过 Lint 操作(每完成 10 个工作流自动触发)定期识别孤儿条目、矛盾结论和过时内容,形成知识库的自清洁能力。Karpathy LLM Wiki 的 Lint 操作被直接借鉴——定期运行矛盾检测、孤儿页面识别和交叉引用完整性检查。^ 这个机制的意义在于:知识的质量不是一次性保证的,而是通过持续治理保持的。对于快速演进的 AI 工程团队,这一点至关重要——3 个月前的"最佳实践"可能已经是今天的反模式。^ 区块链思想用于知识治理的工程可行性 区块链三思想(不可篡改追加日志 / 贡献可溯源 / 共识机制)用 Git 实现,是一个务实的工程选择:用开发者熟悉的工具解决知识治理问题,而不是引入新的复杂系统。^ log.md 只追加不修改确保了知识变更的历史完整性;evidence.contributors[] 提供了知识条目级的贡献追溯,比代码 blame 更细粒度;maturity 的多人验证机制(draft→verified: 1人;verified→proven: ≥2人 + ≥2项目)将共识机制具体化为可执行的规则。^ 文件系统即状态机对异步协作的设计支撑 "所有状态、产物、知识都以 Markdown 文件形式存在,没有数据库"的设计哲学,直接支撑了文章第八节描述的异步审批和多设备工作流流转能力。^ 当每个阶段入口/出口都有明确持久化产物时,Agent 可以在任意时间点暂停、人类在任意时间审批后继续。这解决了 Harness 工作流的"在场依赖"问题——真正实现了 7×24 小时流转而不需要工程师全程在场。^ 与行业 Harness 实践的呼应关系** 文章第一节对比的三大 Harness 实践(OpenAI Codex 的指令协议 / Cursor Self-Driving 的多 Agent 协同 / Anthropic Claude Code 的长时稳定性)分别对应了人机交互、编排和记忆三个维度。腾讯 AI Team 的知识管理框架本质上是为这三个维度提供持续的知识供给和生命周期管理能力。^ 这与 Harness Engineering 全面解读 中描述的"约束校验与失败恢复"支柱以及 Claude Code 大型代码库最佳实践 中的多层记忆系统形成互补——本文提供了知识层面的系统性方案,而行业实践提供了工具层面的具体实现路径。^

实践启示

立即可操作的行动项 1. 建立团队知识 Git 仓库 ^ 创建独立的 team-knowledge.git 仓库,按 Layer 0-T(团队约定)/ Layer 1(技术知识)/ Layer 2(业务知识)/ Layer 3(项目知识)组织目录结构。从 team-conventions/ 开始(代码规范、Commit 规范),这是团队共享知识的最基础层,也是采用摩擦最小的起点。独立仓库确保知识生命周期与业务项目解耦——业务项目归档后知识不会消失。^ 2. 在现有工作流中嵌入知识生产 ^ 不需要新建独立流程。在 INIT 阶段增加 git pull 团队知识仓库;在 ARCHIVE 阶段增加知识提取动作(@archiver 自动从产物中提取 decision/pitfall/guideline)。对 Agent 来说,这是工作流的标准步骤,不额外增加负担;对团队来说,这是知识积累的自然来源。^ 3. 引入五种知识类型标准化团队语言 ^ 用 model/decision/guideline/pitfall/process 五种类型为团队知识打标签。当团队讨论"这条知识属于什么类型"时,减少了歧义,建立了共同语言。"广告预算扣减在高并发下会超扣"是 pitfall,"选择事件驱动而非 RPC 同步"是 decision——类型清晰后,Agent 和工程师对知识的预期一致。^ 4. 建立 maturity 验证机制 ^ 从 draft 开始,通过工作流引用自动提升 maturity:被 1 个工作流引用 → verified;被 ≥2 个不同项目验证 → proven。同时配置自动衰减(proven 12 个月未引用降级,verified 6 个月未引用降级),保证知识库不会随时间腐化。每完成 10 个工作流运行一次 Lint 检查。^ 5. 实现渐进式知识查询而非全量注入 ^ 在 Agent 工作流中实现知识的三层查询:先查询 knowledge-catalog.md(全景目录 ~50行)了解知识库有什么,再按需查询分类 catalog,最后查询具体条目。不在 Agent 启动时全量注入所有知识,而是让 Agent 在决策点按需发现——这既节省上下文,又让知识引用更精准。^ 6. 用文件系统实现状态持久化和跨设备接管 ^ 将每个工作流阶段产物持久化为 Markdown 文件,不依赖内存或特定进程。实现断点恢复和异步审批:Agent 提交产物后暂停,任意时间审批后继续。这解决了工程师"不在工位工作流就卡住"的问题——手机/平板均可接管同一 Agent 会话,真正实现 7×24 小时流转。^ 系统性变革的前提条件 以上行动项可以渐进实施,但有一个前提:团队需要将知识视为与代码同等重要的资产。当团队默认"工作流做完就结束了,不需要沉淀知识"时,任何工具和流程都无效。知识工程的文化基础是:每一次踩坑后的总结都是团队财富,而不只是个人记忆。^ 一旦这个认知建立,工具和流程只是放大这个价值的手段。Git 仓库、Lint 机制、三级 maturity 系统、渐进式索引——这些都只是知识复利系统的工程实现。^ 关联阅读原文存档(本文为腾讯技术工程公众号下篇) → 腾讯知识沉淀体系(同一作者上篇) → (Harness 六层构成与行业实践) → (多层记忆系统与长时稳定性) → Karpathy LLM Wiki V2(渐进式知识披露模式) → 知识管理即护城河(知识管理作为竞争壁垒的核心论点)