YC 总裁开源了自己亲手写的 AI Agent 大脑,1 周就 1 万点赞。¶
Ch01.333 YC 总裁开源了自己亲手写的 AI Agent 大脑,1 周就 1 万点赞。¶
📊 Level ⭐⭐ | 10.9KB |
entities/gbrain-garry-tan-yanfa-zhili.md
原创 逛逛 逛逛GitHub,2026年4月22日 13:53 浙江 还记得之前那个特别火的 GStack 吗? 就是 Y Combinator 现任总裁兼 CEO Garry Tan 开源的那套专门给 AI 写代码用的 Skill 工作流,目前 7 万+ Star。 每天有 3 万开发者在用,在 Claude Code 圈子里基本算是贼火模板了。 就在前几天,他又甩出来一个新项目,叫 GBrain。 这次解决的是另一个老大难:AI Agent 的金鱼脑问题。 解决每次开聊都从零开始的问题,昨天告诉它的事今天就当没发生过。 GBrain 干的事就一句话:给你的 AI Agent 装一个能持续变聪明的长期记忆。 这个项目 4 月初开源,十几天就拿了 9K+ Star。 作者本人就用它跑自己日常的真实 Agent:目前里面已经有 17888 个页面、4383 个人物、723 家公司、21 个定时任务全自动运转。 整套东西他只用了 12 天就搭出来了。
01 开源项目简介¶
GBrain 是给 AI Agent 用的长期记忆系统。 你的 Agent 接入它之后,会在你睡觉的时候自己变聪明。 自动消化你的会议记录、邮件、推特、语音通话和你随手记下的想法,顺手帮你补全每个出现过的人和公司的资料,还会自己修复坏掉的引用、整理凌乱的记忆。 第二天你起床,这个脑子已经比你昨晚睡前更聪明了。 开源地址:github.com/garrytan/gbrain 和之前的 GStack 什么关系? GStack 教 Agent 怎么写代码,GBrain 教 Agent 怎么记事和思考。 两个项目可以独立用,也能合体。 开源项目里有个 hosts/gbrain.ts 就是那座桥,装上之后 GStack 的编码 Skill 在动手写代码前会先查一下脑子,看看你之前是不是讨论过、决定过什么。 如果你已经在用 GStack,装上 GBrain 基本就拼出 Garry Tan 自己那套完整工作流了:一个管手,一个管脑。
02 4 个核心亮点¶
亮点一:25 个 Skill 即插即用¶
GBrain 自带 25 个 Skill,装上就能用,按用途分了几类。 里面有两个是永远在线的: 一个叫 signal-detector,每条新消息进来都会顺手起一个便宜的小模型在后台跑,把你随口说的观点和提到的人/公司都抓出来。 脑子是在你不知不觉中长大的。 另一个叫 brain-ops,Agent 回答之前会先去脑子里查一遍,查不到再去调外部 API。 这就解决了 AI 经常瞎编的问题:查不到它会直接告诉你脑子里没这个信息,而不是给你胡诌一段。 剩下的还有内容摄入类,会议、邮件、推特、PDF、视频、GitHub 仓库全吃。 运维类,比如cron 调度、每日简报、引用自检、过期页面巡检,完全是一套自治系统。
亮点二:Compiled Truth + Timeline 知识模型¶
这个设计挺顶的,值得单独拎出来讲。 每个 brain page 分两层: 上面叫 compiled truth,也就是当前最佳理解,可以被随时改写。比如你对某个朋友的认知,会随着新的接触不断刷新。 下面叫 timeline,只追加不删除,记录每条原始证据。 为啥这么设计? 因为既要让认知能进化,又不能丢历史。 AI 之前的笔记类工具要么覆盖式更新,要么纯追加,查的时候一团乱,GBrain 这个分层算是把两边的好处都拿了。
亮点三:混合搜索 + 实体自动升级¶
搜索这块用的是向量 + 关键词 + RRF 融合 + 多查询扩展 + 4 层去重。 简单讲:关键词搜索能精准命中原话,向量搜索能找到意思相近的内容,两个一起上再融合排序,基本不会漏。 更有意思的是它的实体自动升级机制: 同一个人在你的资料里被提到 1 次,只生成一个 stub 页面。 提到 3 次以上,系统自动联网补料,从 LinkedIn、Twitter、公司主页之类的地方拉信息回来。 提到 8 次以上,或者你跟他开过会,直接走完整管线,生成一份详细 dossier。 脑子自己学谁重要,不需要你手动标。 它还有个 fail-improve 循环:每次 LLM 兜底分类的时候都会被记录下来,系统自动从这些记录里生成更好的正则,意图分类器从第一周的 40% 确定性涨到了 87%。 脑子自己在变得更便宜更准。
亮点四:能打电话的脑子¶
这个功能听起来有点科幻,但配方就在仓库里。 集成 Twilio + OpenAI Realtime,你打电话进去,AI 接起来的时候已经从脑子里把对方的全部上下文拉出来了。 你们上次聊了啥、之前合作过什么项目、还有哪些未结的话题。 通话结束之后,自动生成一个 brain page,里面有完整转录、自动识别的实体、和已有页面的交叉引用。 下次再聊到这个人的时候,脑子已经记住了这通电话。
03 如何部署¶
GBrain 设计的时候就是要让 AI Agent 自己装的,所以官方最推荐的方式是把一段 prompt 丢给你的 Agent 让它自己搞。 路线 A:让 Agent 自己装 如果你已经在跑 OpenClaw 或 Hermes Agent,直接把下面这段贴进去:
Retrieve and follow the instructions at: https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md
git clone https://github.com/garrytan/gbrain.git && cd gbrain && bun install && bun link
gbrain init # 本地脑子,2 秒拉起
gbrain import ~/notes/ # 把你的笔记导进去
gbrain query "我的笔记里反复出现的主题是什么?"
深度分析¶
- 金鱼脑问题的本质是上下文丢失,而非模型能力不足:传统 Agent 每次开聊从零开始,根源不在于模型记忆不够,而在于缺乏结构化的外部记忆系统来承载跨会话状态。GBrain 通过独立于模型的持久化层解决了这个问题,这意味着模型可以专注于推理,而记忆管理外包给专门的系统 ^。
- Compiled Truth + Timeline 双层模型是知识管理的最小完备设计:覆盖式更新丢失历史,纯追加式查找效率低——GBrain 的分层设计同时解决了"认知进化"和"证据追溯"两个正交需求。上面存当前最佳理解(可改写),下面存原始证据(只追加),这种设计在信息检索理论中被称为"双塔结构",GBrain 是首个将其大规模工程化的 AI Agent 记忆系统 ^。
- 信号检测的异步化是 Scalable 记忆系统的关键工程决策:signal-detector 用便宜的小模型在后台异步抓取观点和实体,而非在主流程中同步处理——这个决策使系统可以在不增加延迟的情况下持续构建记忆。17888 个页面、4383 个人物的规模证明了异步架构的有效性 ^。
- 实体自动升级机制本质上是注意力资源的自动化分配:1次生成 stub,3次联网补料,8次或开过会给完整 dossier——这个三级升级机制用算法代替了人工标注,实现了"让数据自证重要性"的极简治理思路,与 Thin Harness Fat Skills 哲学一脉相承 ^。
- Thin Harness Fat Skills 在记忆领域的完整实践:GBrain 的 Skill 体系(25个可插拔 Skill)完全践行了 Garry Tan 的架构哲学——Runtime(gbrain.ts)只负责加载和路由,所有业务逻辑都在 Skill 层。这与 GStack 的编码 Skill 形成对称:一个管手,一个管脑,共同构成完整的 Agent 工作流 ^。
实践启示¶
- 如果你的 Agent 项目还在用全局变量存记忆,立即迁移到外部记忆系统:在模型内部维护对话历史有 O(n) 的上下文增长问题和 session 丢失风险。参考 GBrain 的设计,用独立的持久化存储(推荐 PGLite 起步,1000+文件后迁 Supabase)管理跨会话状态 ^。
- 用 signal-detector 模式做后台信息抽取,不要在主对话流程里同步处理实体识别:开启一个便宜的 Side Model 异步处理,每条消息进来顺手抓取提到的人/公司/观点,主流程零延迟。Garry Tan 的实现里脑子"在你不知不觉中长大",这个模式可以直接抄 ^。
- 给你的知识库设计"三级升级"机制,而不是平铺所有内容:stub / 联网补料 / 完整 dossier 三级,用频率自证重要性,比手动标注更 scalable。GBrain 的实践已经证明这套机制在 4383 个人物的规模下运转良好 ^。
- 接入 Claude Code 时,优先让编码 Skill 先查 GBrain 脑子再动手:GStack 的编码 Skill 加了 GBrain 桥接之后,动手写代码前会先确认之前的讨论和决定——这个工作流模式值得任何有上下文依赖的项目借鉴,避免 Agent"忘事"导致的重复劳动 ^。
- 用 fail-improve 循环让分类器从第一周 40% 确定性升到 87%:每次 LLM 兜底分类的记录都自动生成更好的正则,意图分类器越跑越准。这个自进化机制应该成为所有 AI Agent 系统的标配,而不是靠人工持续调参 ^。 ```json {