使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？¶

Ch04.281 使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？¶

📊 Level ⭐⭐ | 8.8KB | entities/使用-agent-skills-做知识库检索能比传统-rag-效果更好吗.md

核心要点¶

Skills 是 Anthropic 推出的 Agent 领域行业标准，本质是一个文件夹，内含使用说明（SKILL.md）、参考文档（reference）、可执行脚本（script）
渐进式加载策略：启动时仅加载 Skill 基本描述，触发时才按需读取详细文档，避免无谓的 Token 消耗
用 Skills 模式做知识检索：不预建向量库，本地目录级渐进式检索，可视为"Agentic RAG"
优势在于大模型参与分词和上下文匹配决策，而非单纯向量匹配后做总结
缺陷：首次检索 PDF 等特殊格式效率低；多轮检索后 AI 可能忘记调用 Skill；Token 消耗较大
可通过 Skill Creator 自动分析已有文档站并生成定制检索 Skill

深度分析¶

传统 RAG 的结构性困境¶

传统 Chunk + Embedding RAG 模式的核心缺陷在于"预索引"的刚性。作者在文中坦承自己对这套方案的偏见源于真实的调优痛苦——调优过程极其折腾，最终效果仍难保证。这并非个别现象，而是向量检索范式本身的结构性局限：分块大小固定、语义边界难以对齐、Embedding 模型对领域术语的理解有限、检索结果依赖向量相似度而非真实语义匹配。 LlamaIndex 创始人 Jerry Liu 的判断佐证了这一判断：RAG 本身没死，但固定 Chunk + Embedding 那套模式已走到尽头。如果 Agent 能动态扩展文件周围的上下文，过度考虑数据块大小就失去了意义。这一转变的本质是从"检索后总结"（Retrieve-then-Read）到"自主式检索+理解"（Agentic Retrieve）的范式跃迁。

Skills 渐进式披露架构的创新价值¶

Anthropic Skills 的渐进式加载策略在此场景中展现了独特的优势：启动时只加载 Skill 基本描述，AI 根据用户需求自主判断调用哪个 Skill，决定后再读取详细说明和参考文档。这套机制恰好解决了一个知识检索的核心矛盾：上下文窗口有限 vs. 知识库规模庞大的张力。通过将"领域定位 → 文件定位 → 内容定位"三层结构分别封装在不同层次的文档中，AI 可以像人类专家一样"先大致知道该查哪个领域，再精准打开相关文件，最后定位到具体段落" 。这与人类检索知识的行为模式高度吻合——先按主题缩小范围，再按文件类型选择合适的读取策略，最后结合上下文理解内容。

技术实现的关键设计原则¶

该方案有两点关键设计原则值得关注。其一是渐进式检索：尽量少读但读准，优先查"最可能有答案"的文件，读取时仅读取相关行，必要时再扩展范围，避免无意义的 Token 消耗。其二是保持简单可控：用户只需告诉系统知识库位置，其余检索策略由 Skill 自动完成。针对不同文件类型，Skill 采用了差异化策略：Markdown/文本直接定位匹配段落；PDF 编写代码调用专门解析能力按页/章节提取；Excel 则只读取与问题相关的表、行、列，而非将整份表格加载进来。这一精细化策略显著优于传统 RAG 的"整块加载+向量检索"模式。

当前方案的局限与边界¶

方案并非银弹，存在若干已知限制。PDF 首次处理需要调用脚本转换，效率较低（建议预处理为纯文本规避）；多轮检索后 AI 可能"忘记调用 Skill"，丢失关键处理步骤；Token 消耗相对较大，因为 AI 控制整个检索过程，首次未找到答案时会持续尝试新参数或文件进行检索。这些限制的根本原因在于：当前方案仍然依赖 AI 的推理能力来驱动检索策略，而 AI 的推理具有不可预测性。与预建向量库相比，动态检索方案的上限更高（更精准），但下限也更低（不稳定）。

实践启示¶

1. 知识库建设优先考虑按领域分目录 文件夹尽量按领域划分，每个文件夹下只包含特定领域的文件，并在每个文件夹放置目录索引文件 data_structure.md 描述每个文件的用途。这不仅是信息架构的最佳实践，也为 AI 提供了"渐进式定位"的结构基础。 2. 对已有文档站先尝试 Skill Creator 而非从头构建 RAG 如果已有固定格式的本地文档站（md/mdx 文件），直接用 Skill Creator 让 AI 分析文档站结构并自动生成定制检索 Skill，效果好且速度快。先用纯文本文档验证效果，再逐步引入 PDF/Excel 等特殊格式。 3. 评估是否迁移的时机信号 当你的 RAG 调优已经花费大量精力但效果仍不稳定；当你的知识库需要跨多种异构格式联合查询；当你的场景需要"多轮递进式检索"而非一次性查询——满足以上任一条件时，值得评估 Skills 模式的迁移方案。 4. 警惕 Token 消耗与首次延迟 对于高频、实时性要求高的知识查询场景，当前方案的 Token 消耗和首次 PDF 转换延迟是主要瓶颈。建议：预处理阶段将所有 PDF 提前转换为 Markdown，保持知识库的纯文本状态。 5. 复用开源 Skill 降低起步成本 文中提供的开源 Skill（https://github.com/ConardLi/rag-skill/）可作为起点，根据自身知识库结构进行微调，而非从零构建。