卡帕西\"LLM Wiki\",到底是什么?——用 Claude + Obsidian 给自己造一个第二大脑的完整拆解¶
Ch01.321 卡帕西\"LLM Wiki\",到底是什么?——用 Claude + Obsidian 给自己造一个第二大脑的完整拆解¶
📊 Level ⭐⭐ | 11.6KB |
entities/karpathy-llm-wiki-second-brain-awkthole.md
卡帕西"LLM Wiki",到底是什么?——用 Claude + Obsidian 给自己造一个第二大脑的完整拆解¶
核心结论¶
- Karpathy主张:用markdown维护个人wiki,喂给Claude——LLM时代的"第二大脑"
- 三判断:LLM as OS → Markdown是LLM母语 → 隐性知识显性化是杠杆前置
- 2025年三推力到位:200K上下文+Projects+Claude Code
Karpathy三判断¶
| 判断 | 核心 | 工程含义 |
|---|---|---|
| LLM as new OS | 模型=CPU,需持久化"硬盘" | 每次cold start从零是过渡态 |
| Markdown=LLM母语 | 训练分布决定最优格式 | Notion/Word/印象笔记含噪音 |
| 隐性知识显性化 | LLM放大表达清楚的东西 | wiki逼你把模糊认知写清楚 |
Context Window工程分析¶
200K tokens = 30万字中文 ≈ 半部《资治通鉴》
暴力上下文(全量wiki进窗口) > RAG切片: - Transformer全局注意力:所有token两两计算关联权重 - RAG切片:局部最优,永远缺失全局推理能力 - 2025年硬件+Projects软件+CLAUDE.md协议三件套齐了,卡帕西的设想才从"理论上对"变成"可搭起来"
Markdown Token经济学¶
- Markdown:100% token,LLM训练分布友好
- HTML:150%+ token,80%是标签噪音
- LLM对markdown的认知是模式匹配级反射——不需推理
Obsidian不可替代性¶
- 本地.md文件——无云端锁定,LLM可直接读
- 维基百科词条链接——语义索引,模型自动关联
- 开放插件生态——不被单一工具锁死
- 永久可迁移——.md永远归你
协议栈(LLM as OS对位)¶
- 推理层:Claude (200K上下文+全局注意力)
- 协议层:Markdown (LLM母语+高信噪比)
- 管理层:Obsidian (本地优先+双向链接+插件)
- 持久层:本地硬盘+Git (永远归你+版本控制)
组件可独立替换,资产完全可迁移——Unix哲学
深度分析¶
为什么"第二大脑"这个比喻成立¶
传统知识管理工具(Notion、Obsidian、Roam)本质上是人的记忆辅助工具——它们帮助人组织、检索、连接信息。但这些工具的"智能"全部来自人自己:人写入、人关联、人检索。
Karpathy方案的本质转变是:把LLM也纳入这个回路,让模型成为知识的共同参与者而非仅仅是检索引擎。这要求知识库必须满足两个条件:
- LLM能完整理解——格式必须是LLM训练分布中的主流(Markdown > Notion > Word)
- LLM能全局推理——上下文必须完整,不能被切片(200K暴力上下文 > RAG切片)
只有同时满足这两个条件,LLM才能执行超越关键词匹配的高级认知任务:因果推理、类比联想、假设演绎。
"LLM as OS"的真实含义¶
Karpathy的OS比喻不是修辞,而是字面意义上的架构映射:
| 计算机OS | LLM Wiki OS |
|---|---|
| CPU(计算) | LLM(推理) |
| 内存(临时状态) | Context Window(当前会话) |
| 硬盘(持久存储) | Markdown Wiki(长期记忆) |
| 文件系统(组织) | Obsidian Vault(双向链接图) |
| 系统API(接口) | CLAUDE.md协议(项目约定) |
这个架构的核心洞察是:当前LLM的"失忆"不是bug,而是过渡态。当200K上下文成为标配、当Projects成为标准接口,LLM的cold start问题就有了工程解法——不是在模型本身修,而是在外部存储层补。
为什么RAG在这个场景下是次优解¶
RAG(检索增强生成)在知识问答场景表现优异,但在个人wiki场景存在结构性缺陷:
RAG的局部最优性:向量检索找到的是"语义相似"的chunk,但知识的关联往往是"逻辑相邻"——两段文字向量距离远,但逻辑上必须同时存在才能推理。RAG永远无法保证这一点,而全量上下文可以。
Transformer的全局注意力是key:当你把整个wiki塞进上下文,模型实际上在做"所有token对所有token"的注意力计算。这意味着笔记A中的某个细节,可能和笔记Z中的某个概念在深层语义上形成关联——这种关联是RAG永远捕捉不到的。
实践中的信噪比问题:RAG切片后,每个chunk单独向量话,丢失了文档结构信息。全量Markdown保留了标题层级、列表结构、链接关系——这些结构性信息本身就是语义信号。
Markdown作为"LLM母语"的更深层含义¶
不仅是训练分布问题。Markdown的语法本身就是人类逻辑结构的最小化表达:
# 标题= 新主题开始## 子标题= 父子层级关系Wikilink= 语义关联引用- 列表= 并列关系> 引用= 元信息/背景设定
这些对人类来说的视觉标记,对LLM来说是可直接编程处理的结构化信号。LLM不需要"理解"这些是什么——它们是内置在模型权重中的模式反射。这就是为什么同样的内容,Markdown格式比纯文本给LLM的效果好得多。
实践启示¶
如何开始构建自己的LLM Wiki¶
起点极简:不要一开始就想着建立完美的知识体系。从一篇笔记开始——把你现在正在研究的问题写下来,用Claude帮忙扩充、关联、提问。wiki是进化出来的,不是设计出来的。
CLAUDE.md是入口:在项目根目录放一个CLAUDE.md,约定项目背景、当前状态、待决问题。这是给LLM的"启动程序",让它理解你是谁、你在做什么、你的偏好是什么。
笔记格式优先级:纯文本 > Markdown > HTML > Word > Notion。如果你的知识在Notion里,先导出为Markdown再喂给LLM。
Obsidian使用建议(非必须,但值得)¶
| 功能 | 作用 | 优先级 |
|---|---|---|
| 本地.md存储 | 资产永久可控 | 必须 |
| 双向链接 | 知识关联可视化 | 强烈推荐 |
| Templater插件 | 笔记模板标准化 | 推荐 |
| Dataview插件 | 按标签/日期聚合 | 可选 |
| 社区LLM插件 | 生态保持跟进 | 谨慎 |
核心原则:Obsidian是工具,不是目的。如果VS Code + Git能让你更好,那就是你的最佳方案。Karpathy本人用的就是极简set-up。
Wiki内容组织的实践原则¶
- 原子化:每篇笔记一个核心观点,便于复用和组合
- 链接优先于标签:标签是分类,链接是关系。关系比分类更重要
- 写下来本身就是目的:不要想着"这篇笔记以后有用"才写。当下写,LLM当下帮到你,这个回路本身就是价值
- 允许笔记是半成品:wiki不是百科全书,是思考过程的痕迹。模糊的笔记 > 没写的笔记
防坑指南¶
- 不要过度结构化:花大量时间设计标签体系、目录结构是浪费。wiki的价值在于内容,不在于形式
- 不要追求完美引用:每篇笔记都要求完整来源是完美主义陷阱。先写,来源补了是锦上添花
- 不要把所有东西都塞进去:wiki是个人知识库,不是公共百科。个人经历、私人思考、随手笔记都可以是wiki的一部分
- 上下文窗口不是无限的:虽然200K很大,但仍然要管理。优先放最相关、最常用的知识进高频上下文
低门槛实践方案:WorkBuddy + Obsidian¶
Claude Code 上手门槛较高,WorkBuddy 提供了更低门槛的替代方案:工作空间指向 Obsidian vault,通过自然语言指令驱动知识编译。
数据采集双通道¶
| 场景 | 工具 | 流程 |
|---|---|---|
| PC端网页 | Obsidian Web Clipper | 浏览器一键剪藏→raw/目录 |
| 移动端微信 | IMA知识库中转 | 微信一键收藏→IMA→WorkBuddy定时同步→raw/ |
| 飞书/钉钉 | CLI工具+定时任务 | 平台API同步→raw/ |
移动端数据采集的核心痛点是操作断裂:公众号链接→电脑端→浏览器→Web Clipper。IMA 知识库作为中转站解决这个问题,尤其对微信生态内容友好。
知识编译+查询+治理三件套¶
- 编译:WorkBuddy 读取 raw/ 新增文件 → 按 AGENTS.md 规范生成 wiki/ 实体+概念页 → 更新 index.md + log.md
- 查询:先读 index.md 判断相关页面 → 再加载对应 wiki 页面综合回答(渐进式展开,与 Skills 渐进式披露机制一致)
- 治理:WorkBuddy 定时任务每周检查孤立页面、断链、矛盾,保持知识库健康
企业场景的三大局限¶
LLM Wiki 在企业级知识库场景面临结构性限制,不能简单替代 RAG:
| 维度 | 问题 | RAG 优势 |
|---|---|---|
| 数据规模 | wiki 文档膨胀到百/千级时 Token 消耗飙升,index.md 可能撑爆上下文 | 向量检索按需召回,规模无关 |
| 权限管理 | 缺乏细粒度访问控制,难满足企业安全合规 | 文档级/段落级权限隔离成熟 |
| 可溯源性 | 依赖模型理解重构,幻觉风险高,错误关联一旦写入会污染后续所有查询 | 可精确定位"回答来自哪篇文档哪一段" |
[!contradiction] 参见 Karpathy LLM Wiki 第二大脑 — 原始方案认为 LLM Wiki 的全局推理能力优于 RAG 切片,但企业场景下规模和溯源问题使这一优势反转
适用场景判断:个人知识库、学习研究等低风险场景 → LLM Wiki 效率高体验好;企业知识库 → 需按数据规模、权限要求、引用准确性综合评估
相关实体¶
- Llm Wiki Architecture
- Karpathy Claude Md Rules
- Obsidian Llm Wiki Local Kytmanov
- Claude Md 12 Rules Mnilax
- Karpathy Vibe Coding Agentic Engineering V3
→ 原文存档 - yc掌门人60天写了60万行代码:gstack开源 - markdown 不会过时 - Hermes Skills + LLM Wiki 知识系统
→ 补充存档:WorkBuddy + LLM Wiki + Obsidian 实践