跳转至

Demis Hassabis YC Interview: AGI 时间线、记忆机制、Agent 未来

Ch04.136 Demis Hassabis YC Interview: AGI 时间线、记忆机制、Agent 未来

📊 Level ⭐⭐ | 13.4KB | entities/demis-hassabis-yc-interview-jiedaotixi.md

Demis Hassabis YC Interview: AGI 时间线、记忆机制、Agent 未来

原文存档

摘要

Google DeepMind CEO Demis Hassabis 与 YC 总裁 Garry Tan 的深度访谈,涵盖 AGI 时间线(2030 年)、当前大模型的局限(持续学习、长期推理、记忆)、AlphaGo 思想回归 Gemini、模型蒸馏的极限、Agents 的未来、AI 在基础推理上的"锯齿状智能"失败、以及对深科技创业者的建议。Hassabis 长期主义视角与对 AI 现状的冷静评估对构建 AGI 路径的工程团队极具参考价值。

核心要点

  • AGI 时间线预期:2030 年——深科技创业者必须考虑 AGI 在 10 年周期中点出现的可能性
  • 当前大模型的核心局限:持续学习、长期推理、记忆仍未根本解决
  • 思维链推理是 AlphaGo 搜索模式的回归,DeepMind 正在重新审视 MCTS
  • 模型蒸馏(Flash 系列)已达 1/10 价格、90-95% 能力,且未见理论极限
  • 工程师效率提升 500-1000 倍(vs 2000 年代 Google 工程师)
  • Agents 6-12 个月内将从"玩具演示"变为生产力工具
  • "锯齿状智能"现象:模型在基础推理上仍然失败
  • 创造力新标准:AI 是否能"发明围棋本身"——需要类比推理能力突破
  • AlphaFold 突破三要素:组合搜索空间 + 清晰目标函数 + 足够数据/合成数据模拟器
  • "爱因斯坦测试":训练截止到 1901 年的知识,看 AI 能否独立推出狭义相对论

深度分析

AGI 时间线:2030 年与深科技创业的张力

Hassabis 明确给出 AGI 时间线预期:2030 年。这对深科技创业者构成结构性挑战:

"如果你今天开启一段深科技(Deep Tech)创业历程,通常意味着这将是一个长达 10 年的周期。那么,你现在就必须考虑到 AGI 可能会在这段历程的中途出现。这意味着什么?这未必是一件坏事,但你必须将这个因素纳入考量。"

这种"AGI 在中点出现"的视角要求创业者:

  • 不要把产品设计建立在"AI 长期不会达到 X 能力"的假设上
  • 考虑"如果 5 年后 AGI 出现,公司的护城河在哪里"
  • 倾向于选择"AGI 出现后会更重要而非被取代"的方向(如硬件、能源、生物)

当前架构的根本局限:记忆、推理、持续学习

Hassabis 认为现有的技术架构可能不足以直接通向 AGI——还有"一两个大想法"需要攻克:

1. 持续学习:目前的 Agent 还不能很好地适应新环境——必须能够学习具体场景的上下文。这是阻碍智能体完成复杂任务的关键瓶颈。只有解决了持续学习,智能体才能真正实现"发射后不管"的自主操作。

2. 长期推理:模型在某些场景能解决世界数学奥林匹克级别的难题,却在基础的小学数学或简单逻辑推理上出错。Hassabis 称之为"锯齿状智能"——能力在某些维度很高、某些维度很低,且缺乏一致性。

3. 记忆机制:目前的大模型基本上是无状态的。为了让模型记住信息,简单的做法是不断扩大上下文窗口——但 Hassabis 直言这种方式"更像是用胶带把系统粘在一起"。

真正的记忆应该是优雅的整合——他在博士期间研究海马体时发现:人类大脑会在睡眠中回放重要片段,将新知识整合进现有知识库。AI 需要在记忆系统上有本质的创新,才能高效处理长达数月的个人信息或实时视频。

"锯齿状智能"的具象案例:下棋走错路

Hassabis 给出了一个生动的具体例子:

他和 Gemini 下棋时发现,模型有时会意识到自己走了一步错棋,但由于找不到更好的选择,它会绕一圈回来接着走那步错棋。这种现象不应该出现在精确的推理系统中。

这暴露了当前大模型的一个根本缺陷:系统缺乏对自身思维过程进行监控和内省的能力。模型能识别错误但不能修复错误,只能循环往复。这不是简单的 prompt 优化能解决的,需要架构层面的元认知能力。

AlphaGo 思想回归:从语言模型到搜索 + 推理

很多人认为 AI 路径已经完全转向语言模型,但 Hassabis 透露 AlphaGo 的核心思想正在回归

现在的思维链推理,其实就是 AlphaGo 搜索模式的一种回归。DeepMind 正在大规模重新审视一些旧的想法,包括蒙特卡洛树搜索(MCTS),并尝试将其应用在今天的基础模型上。

这是一个重要的信号:DeepMind 认为纯语言模型范式有天花板,需要把"搜索"(Search)+ "推理"(Reasoning)+ "学习"(Learning)三者结合。这对构建 Agent 的团队意味着:

  • 不要把 CoT(Chain of Thought)当作思维链推理的终极实现
  • 探索 MCTS + LLM 的组合应用
  • 关注 DeepMind 在"搜索增强推理"上的开源进展

模型蒸馏的极限:Flash 系列的启示

DeepMind 投入了大量精力在模型蒸馏上。Flash 系列模型能以 1/10 的价格达到前沿模型 90%-95% 的能力,且目前尚未看到蒸馏过程的理论极限

由于 Google 拥有巨大的用户量(搜索、地图、YouTube),系统必须以极快、高效且低成本的方式提供服务。这种"规模驱动效率优化"的动力让小型模型能力不断逼近大型前沿模型。

对自建 LLM 应用的团队启示:用蒸馏小模型替代前沿大模型可显著降低成本,90-95% 能力足以满足大多数生产场景。

1000 倍工程师:AI 时代的生产力飞跃

Hassabis 提到:

现在的工程师利用 AI,产出已经是六个月前的数倍。如果对比 2000 年代的 Google 工程师,现在的开发者效率提升了 500 到 1000 倍。以前需要 6 个月完成的游戏原型,现在半小时就能做出来。

这是 DeepMind 视角的"AI 加速度"——不是渐进式提升,而是数量级跃迁。但需要警惕:这种效率提升主要体现在原型/UI 类任务,对核心算法的提升幅度未必有这么大。

"发明围棋本身":创造力的真正标准

Hassabis 提出一个更高的创造力标准:

AlphaGo 的第 37 招确实很有创造力,但 AI 能不能发明围棋本身?这意味着系统要能根据高层级的描述(比如:规则简单、内涵深奥、需要一生去掌握),创造出一个全新的范式。

目前的系统还做不到这一点,除了模式匹配,还需要类比推理能力的突破。

这是对当前生成式 AI 创造力的冷静评估——AI 能创造"围棋里的第 37 招"(在已有范式内的精彩解),但不能"发明围棋本身"(从无到有创造新范式)。这为真正具备创造力的 AGI 划定了清晰的边界。

Agents 的未来:6-12 个月内从玩具到工具

Hassabis 对 Agents 的判断:

虽然现在很多人在进行实验,但输出的产出往往难以证明巨大的资源投入是值得的。但接下来的 6 到 12 个月内,智能体将从"玩具式的演示"变成真正能交付完整价值的生产力工具。智能体是通往 AGI 的必经之路,必须拥有一个能主动解决问题的系统。

这是一个很强的时间线承诺——他预测 2026-2027 年 Agents 将从 toy 变为 production tool。结合 2030 AGI 时间线,Agent 是 AGI 路径上的关键中间产物。

本地 AI 与开放权重的战略

Google 决定将 Nano 级别的模型完全开放权重。这不仅是出于战略考虑,也是因为:

  • 边缘设备上的模型本就容易泄露(reverse engineering 难度低),不如干脆彻底开放
  • 本地模型的优势是隐私和安全——未来用户可能会在手机、眼镜、家用机器人上运行极其强大的本地模型

未来架构预测:本地模型 + 云端巨型模型协作编排——敏感音视频流留在本地处理,云端巨型模型负责复杂推理与全局协调。

AlphaFold 突破模式与"虚拟细胞"的 10 年目标

DeepMind 总结 AlphaFold 类突破的三个核心要素:

  1. 问题具有巨大的组合搜索空间(暴力算法无法解决)
  2. 有清晰的目标函数
  3. 有足够的数据或能生成合成数据的模拟器

只要满足这些条件,AI 就能在海量可能性中找到"大海捞针"般的解。

下一个大目标是构建完整的"虚拟细胞"——预测真实细胞反应的全方位模拟。Hassabis 预测这大约需要 10 年。目前的瓶颈在于如何在不杀死细胞的前提下获得高分辨率的动态成像数据

"爱因斯坦测试":科学推理能力标准

Hassabis 提出一个科学推理能力的测试标准:

如果给一个 AI 系统训练截止到 1901 年的知识,看它能不能独立推导出爱因斯坦在 1905 年提出的那些发现(包括狭义相对论)?如果 AI 能够独立提出这类改变人类认知边界的假说,而不仅仅是解决已有的问题,它才真正算得上具备了科学推理能力。

这是一个可操作的 AGI 测试标准——既不是"图灵测试"那种黑盒判断,也不是简单的 benchmark。它是"是否能从已有知识中独立推导出改变人类认知边界的假说"

AGI 到来前该建造什么

由于 AGI 可能会在 2030 年左右到来,创始人构建长期深科技项目时必须考虑 AGI 在中途点出现的可能性:

未来的架构不太可能是一个统治一切的巨型大脑,而更可能是一个通用的工具调用模型去调度各种专业工具(类似调度 AlphaFold 进行蛋白质折叠)。创始人应该在这一趋势下,想象未来的工厂、金融系统和物理世界的形态。

这是一个关键的架构预测:AGI 时代的多 AI 系统是"通用调度者 + 专业工具"模式而非"一个巨型大脑"——这对 Agent 框架设计有直接指引。

实践启示

对 AI Agent 构建者

  • 不要把当前架构当作终态:持续学习、长期推理、记忆机制是三个明确的待攻克问题,构建架构时应预留扩展空间
  • MCTS + LLM 是值得探索的方向:DeepMind 自己正在回归 AlphaGo 思想,意味着这条路径可能有重大突破
  • 小模型蒸馏是降本的关键:Flash 类蒸馏模型可以 1/10 价格提供 90-95% 能力,应作为生产环境的默认选择
  • Agent 是 AGI 的中间产物:6-12 个月从 toy 到 tool 的窗口期是关键的工程化机会

对深科技创业者

  • AGI 在 10 年周期中点出现:不要把产品护城河建立在"AI 长期不会达到 X"的假设上
  • 选择"AGI 出现后更重要"的方向:硬件、能源、生物等领域有更深的护城河
  • AlphaFold 三要素是筛选标准:组合搜索空间 + 清晰目标函数 + 足够数据 = AI 突破机会
  • 不要追逐浅表问题:Hassabis 的建议是"如果你不去推动,世界就不会因此改变"

对 AI 产品架构师

  • 本地 + 云端混合架构:敏感数据本地处理,复杂推理云端编排——这是隐私与能力的平衡
  • 通用调度者 + 专业工具:未来 AI 系统不是单体巨型大脑,而是"调度 + 工具"组合
  • 元认知能力是 AI 的下一道关:当前模型能识别错误但不能修复错误,这是系统性的架构缺陷

对科学发现 AI 工具设计者

  • 虚拟细胞的 10 年目标:动态成像数据采集是瓶颈,相关工具(自动化显微镜、AI 辅助细胞培养)有重要机会
  • "爱因斯坦测试"作为 AGI 评估标准:训练截止到某个时点的知识,看能否独立推出改变认知的假说——这是比 benchmark 更有意义的评估

相关实体

  • Tencent Ai Infra Backend Engineer Huangrunpeng — AI Infra 视角
  • Pydantic Ai Progressive Agent Skills Automatorrunner — Agent 框架视角
  • Harness Engineering — 工程化方法论
  • 原文存档
  • MOC