跳转至

卡帕西\"LLM Wiki\",到底是什么?——用 Claude + Obsidian 给自己造一个第二大脑的完整拆解

Ch01.321 卡帕西\"LLM Wiki\",到底是什么?——用 Claude + Obsidian 给自己造一个第二大脑的完整拆解

📊 Level ⭐⭐ | 11.6KB | entities/karpathy-llm-wiki-second-brain-awkthole.md

卡帕西"LLM Wiki",到底是什么?——用 Claude + Obsidian 给自己造一个第二大脑的完整拆解

核心结论

  • Karpathy主张:用markdown维护个人wiki,喂给Claude——LLM时代的"第二大脑"
  • 三判断:LLM as OS → Markdown是LLM母语 → 隐性知识显性化是杠杆前置
  • 2025年三推力到位:200K上下文+Projects+Claude Code

Karpathy三判断

判断 核心 工程含义
LLM as new OS 模型=CPU,需持久化"硬盘" 每次cold start从零是过渡态
Markdown=LLM母语 训练分布决定最优格式 Notion/Word/印象笔记含噪音
隐性知识显性化 LLM放大表达清楚的东西 wiki逼你把模糊认知写清楚

Context Window工程分析

200K tokens = 30万字中文 ≈ 半部《资治通鉴》

暴力上下文(全量wiki进窗口) > RAG切片: - Transformer全局注意力:所有token两两计算关联权重 - RAG切片:局部最优,永远缺失全局推理能力 - 2025年硬件+Projects软件+CLAUDE.md协议三件套齐了,卡帕西的设想才从"理论上对"变成"可搭起来"

Markdown Token经济学

  • Markdown:100% token,LLM训练分布友好
  • HTML:150%+ token,80%是标签噪音
  • LLM对markdown的认知是模式匹配级反射——不需推理

Obsidian不可替代性

  1. 本地.md文件——无云端锁定,LLM可直接读
  2. 维基百科词条链接——语义索引,模型自动关联
  3. 开放插件生态——不被单一工具锁死
  4. 永久可迁移——.md永远归你

协议栈(LLM as OS对位)

  • 推理层:Claude (200K上下文+全局注意力)
  • 协议层:Markdown (LLM母语+高信噪比)
  • 管理层:Obsidian (本地优先+双向链接+插件)
  • 持久层:本地硬盘+Git (永远归你+版本控制)

组件可独立替换,资产完全可迁移——Unix哲学

深度分析

为什么"第二大脑"这个比喻成立

传统知识管理工具(Notion、Obsidian、Roam)本质上是人的记忆辅助工具——它们帮助人组织、检索、连接信息。但这些工具的"智能"全部来自人自己:人写入、人关联、人检索。

Karpathy方案的本质转变是:把LLM也纳入这个回路,让模型成为知识的共同参与者而非仅仅是检索引擎。这要求知识库必须满足两个条件:

  1. LLM能完整理解——格式必须是LLM训练分布中的主流(Markdown > Notion > Word)
  2. LLM能全局推理——上下文必须完整,不能被切片(200K暴力上下文 > RAG切片)

只有同时满足这两个条件,LLM才能执行超越关键词匹配的高级认知任务:因果推理、类比联想、假设演绎。

"LLM as OS"的真实含义

Karpathy的OS比喻不是修辞,而是字面意义上的架构映射

计算机OS LLM Wiki OS
CPU(计算) LLM(推理)
内存(临时状态) Context Window(当前会话)
硬盘(持久存储) Markdown Wiki(长期记忆)
文件系统(组织) Obsidian Vault(双向链接图)
系统API(接口) CLAUDE.md协议(项目约定)

这个架构的核心洞察是:当前LLM的"失忆"不是bug,而是过渡态。当200K上下文成为标配、当Projects成为标准接口,LLM的cold start问题就有了工程解法——不是在模型本身修,而是在外部存储层补。

为什么RAG在这个场景下是次优解

RAG(检索增强生成)在知识问答场景表现优异,但在个人wiki场景存在结构性缺陷:

RAG的局部最优性:向量检索找到的是"语义相似"的chunk,但知识的关联往往是"逻辑相邻"——两段文字向量距离远,但逻辑上必须同时存在才能推理。RAG永远无法保证这一点,而全量上下文可以。

Transformer的全局注意力是key:当你把整个wiki塞进上下文,模型实际上在做"所有token对所有token"的注意力计算。这意味着笔记A中的某个细节,可能和笔记Z中的某个概念在深层语义上形成关联——这种关联是RAG永远捕捉不到的。

实践中的信噪比问题:RAG切片后,每个chunk单独向量话,丢失了文档结构信息。全量Markdown保留了标题层级、列表结构、链接关系——这些结构性信息本身就是语义信号。

Markdown作为"LLM母语"的更深层含义

不仅是训练分布问题。Markdown的语法本身就是人类逻辑结构的最小化表达

  • # 标题 = 新主题开始
  • ## 子标题 = 父子层级关系
  • Wikilink = 语义关联引用
  • - 列表 = 并列关系
  • > 引用 = 元信息/背景设定

这些对人类来说的视觉标记,对LLM来说是可直接编程处理的结构化信号。LLM不需要"理解"这些是什么——它们是内置在模型权重中的模式反射。这就是为什么同样的内容,Markdown格式比纯文本给LLM的效果好得多。

实践启示

如何开始构建自己的LLM Wiki

起点极简:不要一开始就想着建立完美的知识体系。从一篇笔记开始——把你现在正在研究的问题写下来,用Claude帮忙扩充、关联、提问。wiki是进化出来的,不是设计出来的。

CLAUDE.md是入口:在项目根目录放一个CLAUDE.md,约定项目背景、当前状态、待决问题。这是给LLM的"启动程序",让它理解你是谁、你在做什么、你的偏好是什么。

笔记格式优先级:纯文本 > Markdown > HTML > Word > Notion。如果你的知识在Notion里,先导出为Markdown再喂给LLM。

Obsidian使用建议(非必须,但值得)

功能 作用 优先级
本地.md存储 资产永久可控 必须
双向链接 知识关联可视化 强烈推荐
Templater插件 笔记模板标准化 推荐
Dataview插件 按标签/日期聚合 可选
社区LLM插件 生态保持跟进 谨慎

核心原则:Obsidian是工具,不是目的。如果VS Code + Git能让你更好,那就是你的最佳方案。Karpathy本人用的就是极简set-up。

Wiki内容组织的实践原则

  1. 原子化:每篇笔记一个核心观点,便于复用和组合
  2. 链接优先于标签:标签是分类,链接是关系。关系比分类更重要
  3. 写下来本身就是目的:不要想着"这篇笔记以后有用"才写。当下写,LLM当下帮到你,这个回路本身就是价值
  4. 允许笔记是半成品:wiki不是百科全书,是思考过程的痕迹。模糊的笔记 > 没写的笔记

防坑指南

  • 不要过度结构化:花大量时间设计标签体系、目录结构是浪费。wiki的价值在于内容,不在于形式
  • 不要追求完美引用:每篇笔记都要求完整来源是完美主义陷阱。先写,来源补了是锦上添花
  • 不要把所有东西都塞进去:wiki是个人知识库,不是公共百科。个人经历、私人思考、随手笔记都可以是wiki的一部分
  • 上下文窗口不是无限的:虽然200K很大,但仍然要管理。优先放最相关、最常用的知识进高频上下文

低门槛实践方案:WorkBuddy + Obsidian

Claude Code 上手门槛较高,WorkBuddy 提供了更低门槛的替代方案:工作空间指向 Obsidian vault,通过自然语言指令驱动知识编译。

数据采集双通道

场景 工具 流程
PC端网页 Obsidian Web Clipper 浏览器一键剪藏→raw/目录
移动端微信 IMA知识库中转 微信一键收藏→IMA→WorkBuddy定时同步→raw/
飞书/钉钉 CLI工具+定时任务 平台API同步→raw/

移动端数据采集的核心痛点是操作断裂:公众号链接→电脑端→浏览器→Web Clipper。IMA 知识库作为中转站解决这个问题,尤其对微信生态内容友好。

知识编译+查询+治理三件套

  • 编译:WorkBuddy 读取 raw/ 新增文件 → 按 AGENTS.md 规范生成 wiki/ 实体+概念页 → 更新 index.md + log.md
  • 查询:先读 index.md 判断相关页面 → 再加载对应 wiki 页面综合回答(渐进式展开,与 Skills 渐进式披露机制一致)
  • 治理:WorkBuddy 定时任务每周检查孤立页面、断链、矛盾,保持知识库健康

企业场景的三大局限

LLM Wiki 在企业级知识库场景面临结构性限制,不能简单替代 RAG:

维度 问题 RAG 优势
数据规模 wiki 文档膨胀到百/千级时 Token 消耗飙升,index.md 可能撑爆上下文 向量检索按需召回,规模无关
权限管理 缺乏细粒度访问控制,难满足企业安全合规 文档级/段落级权限隔离成熟
可溯源性 依赖模型理解重构,幻觉风险高,错误关联一旦写入会污染后续所有查询 可精确定位"回答来自哪篇文档哪一段"

[!contradiction] 参见 Karpathy LLM Wiki 第二大脑 — 原始方案认为 LLM Wiki 的全局推理能力优于 RAG 切片,但企业场景下规模和溯源问题使这一优势反转

适用场景判断:个人知识库、学习研究等低风险场景 → LLM Wiki 效率高体验好;企业知识库 → 需按数据规模、权限要求、引用准确性综合评估

相关实体

原文存档 - yc掌门人60天写了60万行代码:gstack开源 - markdown 不会过时 - Hermes Skills + LLM Wiki 知识系统

补充存档:WorkBuddy + LLM Wiki + Obsidian 实践