AGI 之路,可能从一开始就走错了(腾讯研究院·王鹏)¶
Ch01.258 AGI 之路,可能从一开始就走错了(腾讯研究院·王鹏)¶
📊 Level ⭐⭐ | 14.1KB |
entities/agi-之路-可能从一开始就走错了.md
AGI 之路,可能从一开始就走错了¶
腾讯研究院资深专家王鹏对当前「以大模型 scaling 为唯一通道的 AGI 路线」发起的系统性质疑。文章把 AGI 现状放进一个完整的因果链来叙述:奥特曼家门口的燃烧瓶 → 这条路线是怎么走上来的(恐惧叙事 + 资本博弈论锁定) → 物理边界(能源、算力)在哪里 → 代价由谁付(弱势国家、低收入劳动者、各国电网) → UBI 为什么救不了普通人 → 一个普通家长用 AI 给孩子做开源课件的实践。它代表了国内顶级研究机构对 LLM 路线的深层反思,也是一份给普通家庭的行动指南。
→ 原文存档
摘要¶
文章的核心判断只有一句:「我们现在所走的这条所谓『通往 AGI』的大模型路线,极有可能从一开始就走错了。它不是科学选择,而是叙事选择;不是技术必然,而是资本和地缘博弈的锁定结果。」 围绕这个判断,全文回答四个问题:(1)它是怎么走上来的?(2)物理边界在哪?(3)代价由谁付?(4)UBI 真能兜底吗?最后给出一个反直觉的结论:救不了你的是监管和 UBI,能救你和孩子的只有教育——而且不能完全依靠今天的公立教育系统。作者用自己两周做出 100+ 门开源 K12 课件的 TeachAny 项目作为收尾的实证。
核心要点¶
- 核心反直觉论点:scaling LLM 通向 AGI 不是技术必然,而是 OpenAI 用恐惧叙事制造的「锁定」——其他公司不跟就死,跟了就被绑上同一条战车
- 历史还原:2015 年马斯克对 DeepMind 的「精神压力」(不是「兴趣」)是 OpenAI 的起点情绪;奥特曼用「现实扭曲力场」把它升级为全球叙事;比尔·盖茨偏好 LLM 而非游戏 AI,决定了 OpenAI + 微软的路径锁定
- 被牺牲的路径:DeepMind 原本走「用小而专的模型一个个解决具体问题」路线,AlphaGo / AlphaFold / AlphaGeometry 都是范例;2025 年 AlphaFold 拿了诺奖、2026 年达沃斯宣布 AI 设计抗癌药进入临床——这才是哈萨比斯「先解决智能,再用智能解决一切」的初心
- 哈萨比斯的被锁定:他清楚 scaling 的天花板(jagged intelligence、不会长期规划、没有持续学习、没有真正创造力、能力锯齿严重),AGI 时间表给 5-8 年;但他必须先做不相信的事(堆大模型),以换取做相信的事的资源(攻克疾病)
- 代价的全球转嫁:美国电网吃紧 → 数据中心选址引发市议员家中弹;圣路易斯小镇议员一夜下台;发展中国家承担标注/审核的最低时薪劳动
- UBI 三层失效:钱从哪里来(AI 利润可跨境避税;地缘竞争中政府不敢真征 AGI 税);OpenResearch 自己的三年 UBI 实验显示工作时间下降、长期收入无显著差异;分配格局会形成极陡金字塔,UBI 更像是「维持秩序」而非「分享财富」
- AGI 的本质差异:过去技术替代某项能力,人可以学新能力规避;AGI 替代的是「学习和使用能力的能力本身」——人类第一次面对「能力天花板」革命
- 行动方向:在公立教育之外,开源、自适应、家长可上手的「第二条教育路径」是普通家庭唯一可控的变量
深度分析¶
「博弈论锁定」是这篇文章最重要的概念¶
作者借用凯伦·郝《AI 帝国》中的论述提出:OpenAI 走出来的不是技术验证,而是博弈论结果。这套逻辑非常精巧:
- 把「做」和「不做」的选择权拿掉——你一质疑就等于在帮坏人
- 把「怎么做」偷换成「做多大」——既然时间紧迫,就必须更大
- 把外部批评者推到不可能赢的位置——任何减速建议都等于站在人类对立面
一旦任何一家先做出更大一号的模型,其他公司在估值、融资、人才争夺上全线落后。整个行业进入「谁不 scale 谁就死」的纳什均衡。这个框架解释了为什么连 DeepMind 这样原本走专业路线的机构也必须做 Gemini,为什么 Anthropic 分裂出来仍然押大模型,为什么坚守专业化的公司都得在内部单开大模型产品线——不是大模型赢了,是 scaling 叙事赢了。
这与 AI 自举和 R&D harness 瓶颈转移中讨论的「能力路径锁定」是同一回事的不同视角。
哈萨比斯的「被锁定的理性」是全文最锋利的隐喻¶
哈萨比斯是 AI 圈里最纯粹的科学家代表——12 岁国象大师、剑桥本科、UCL 神经科学博士、AlphaFold 拿了诺奖。他在公开访谈里明确列出 LLM 路线的四大结构性短板:
- 不会做长期规划
- 没有持续学习(训完即冻结)
- 没有真正的创造力(能解问题但提不出问题)
- 能力锯齿严重(无法预测哪里会出错)
他给出的 AGI 时间表是 5-8 年——比奥特曼/Amodei 保守得多。他保守不是因为不懂,而是因为懂得最深。问题来了:他既然这么清楚 scaling 有天花板,为什么还在跟?
作者给的链式回答是:
- 如果 DeepMind 不做 Gemini,Google 搜索业务被 ChatGPT 瓦解
- 搜索业务瓦解,DeepMind 拿不到训练下一代 AlphaFold 的算力
- 拿不到算力,他一辈子想做的「用 AI 攻克疾病」就做不成
- 所以他必须先做一件他并不最相信的事(堆大模型),以此换取做他最相信的事的资源
「奥特曼制造出来的叙事,不但锁定了投资人和公众,也锁定了真正的科学家」——这是这篇文章最锋利的一句。它把博弈论锁定的影响范围从「企业选型」扩展到了「人类知识精英的注意力分配」。
物理边界与代价转嫁:被刻意低估的外部性¶
文章把外部性问题摆到台面:美国对 AI 焦虑人数已达 64%(斯坦福 2026 AI Index),普通人用燃烧瓶、子弹、选票反对这条路线。同一个月:
- 圣路易斯旁边一个 12,000 人小镇仅因议员批了数据中心项目,选举日被全员踢下台
- 支持建数据中心的市议员家里中了十几发子弹
这些不是孤立事件——它们是「能源 + 水 + 电网」物理资源被算力集群挤压后的社会反弹。作者预言:你的城市可能开始讨论「数据中心优先用水」还是「居民优先用水」;你的电费账单可能因邻近算力扩容悄悄翻倍。这些都是 scaling 路线的隐藏账单。
UBI 的三层失效论证非常扎实¶
第一层 - 钱从哪来:奥特曼说「对 AI 公司征 AGI 税」。但 AI 利润集中在几家公司手里,跨境避税能力极强;地缘竞争里美国政府不敢对 OpenAI / NVIDIA 这种「国家战略资产」动大刀。所以 AGI 税本质上是讲给公众听的故事。
第二层 - 实证:奥特曼自己投资的 OpenResearch 给一千个低收入美国人每月发一千美元、发了三年。2024 年公布的结果:收钱的人短期幸福感改善,但工作时间下降、储蓄率和长期收入与对照组无显著差异。有公开批评直言「这个实验根本不是 UBI 的测试」——因为它没有模拟 AGI 假设的大规模失业场景。
第三层 - 意义崩塌:人不是只需要钱,人需要工作带来的意义感、认同感、社交网络、人生节奏。一个 40 岁前金融分析师发现自己十几年专业积累被一个模型两秒钟覆盖,他的痛苦不是每月一千美元能解决的。
作者最后给 UBI 一个犀利定性:「UBI 在这种格局里的真实功能,很可能不是『分享财富』,而是『维持秩序』——让被替代的大多数人有饭吃、不造反,以便顶端的少数继续安心占有 AI 带来的超额利润。」
TeachAny 案例:用 AGI 的工具反向打破 AGI 锁定¶
文章在结尾出乎意料地转向行动:作者作为「不会写代码的普通家长」,两周内用 AI 做了 100+ 门 K12 课件,每门课包含 ABT 叙事结构、三级脚手架、逐选项错因诊断、Canvas 仿真、拖拽实验。开源在 github.com/weponusa/teachany。
这个案例的精妙在于它打破了一个隐含假设:「这条路的代价只能由制造它的人解决」。作者证明 AGI 路线带来的工具(大模型 + skill 范式)本身就在长出应对工具——可汗学院原本是精英家庭的奢侈品,现在一个普通家长用十几块钱一个月的国产模型 + 开源 Skill 就能做出类似体验。
这与 AI 团队知识 harness的核心理念一致:当 AI 普及到家庭层级,「个性化学习」这件追了 100 年的事,第一次真的可能做成。
「能力天花板革命」是 AGI 与所有过去技术的本质区别¶
文中这句话值得反复咀嚼:「过去所有技术都只替代人的某一项能力,人可以通过学习新能力来规避。而 AGI 替代的是『学习和使用能力的能力本身』。这是人类第一次面临『能力天花板』的革命。」
这把 AGI 从「自动化革命的延续」升级为「一个范畴上不同的事件」。它解释了为什么传统的「技术进步 → 创造新岗位」乐观论这次可能失效——因为新岗位创造的速度跟不上「学习能力本身被覆盖」的速度。
实践启示¶
- 看清「博弈论锁定」:当所有人都在跑同一条路时,先问「这是因为路最优,还是因为不跑就死」
- 关注被牺牲的路径:DeepMind 早期的「专业模型 + 用智能解决具体问题」路线没有死,AlphaFold 系列的诺奖证明它仍在前进
- 理解科学家的「被锁定的理性」:哈萨比斯式的「明知不全对仍在跟」是当代最普遍的精英困境,识别它能让你更准确地解读公开表态
- 不要把 UBI 当救命稻草:从经济学、政治可行性、心理学三个维度都站不住——把它当作「秩序维护工具」理解更准确
- AGI 的外部性账单要看到:能源、水、电网、低端劳动力是隐藏成本,这些会以选票、社会动乱、电费翻倍的形式回到你身上
- 教育是个人能控制的唯一变量:在公立教育之外建第二条路径——TeachAny 类项目证明门槛已经低到普通家长两周可上手
- 关注「AGI 解药」:每一波技术冲击都在长应对工具,开源、自适应、个性化的工作流是普通家庭的杠杆
- 「能力天花板」不同于以往:过去说「技术替代体力,人转向脑力」;这次脑力本身被替代,传统乐观论不适用
相关实体¶
- Agi Road May Be Wrong From The Start Wang Peng Tencent — 同一文章的英文 slug 版本
- Ai Employment Eight Changes Tencent Research — 腾讯研究院对 AI 就业的另一篇分析
- Alphaevolve Deepmind Discovery Agent — DeepMind 专业化路径的代表作
- Alphaevolve Impact Deepmind — DeepMind 路线的影响评估
- 100 年压缩到 100 天红杉资本这就是 Agi — 红杉对 AGI 速度的判断
- Ai Self Improvement Bootstrapping — AI 自举的边界
- Ai R And D When Ai Builds Itself Bottleneck Shift R D Harness — R&D harness 瓶颈转移
- Ai Safety Governance — AI 安全治理
- Reasoning Models — 推理模型与 scaling 替代路径- 腾讯研究院ai速递 20260508
- MOC