Anthropic 联创:2028 年实现 AI 自我构建的概率超过 60%¶
Ch01.069 Anthropic 联创:2028 年实现 AI 自我构建的概率超过 60%¶
📊 Level ⭐ | 6.5KB |
entities/anthropic联创2028-ai自我构建概率超60.md
Anthropic 联创:2028 年实现 AI 自我构建的概率超过 60%¶
Anthropic 联合创始人 Jack Clark 今天发了一篇重磅长文,声称: ** AI 系统自己迭代改造自己,可能就在两年后。 ** 他花了几周时间,翻遍了上百个公开数据源,最后给出了一个概率:到 2028 年底,AI 实现端到端自动化研发的概率, 已经 ** 超过 60%。 **
“ 我现在相信,我们正生活在 AI 研究将被端到端自动化的时代。 这篇文章发在他的 Newsletter「Import AI」第 455 期,标题直接挑明了主题: ** AI 系统即将开始自我构建。 **
相关实体¶
- Www.Infoworld 4171274 Anthropic Puts Claude Agents On A Meter Across Its Subscri
- The Token Economy Pt2 The Intelligence Company Gets Built
- Anthropic Pm Jess Yan Managed Agents
- Anthropic Claude Managed Agents Platform 2026
- Claude Code Hackathon Winners 2026
→ 原文存档
深度分析¶
Jack Clark 给出 60% 概率判断的核心支撑,是一套名为 METR 的自主工作时长追踪数据。从 2022 年 GPT-3.5 的 30 秒,到 2026 年 Opus 4.6 的 12 小时,这条曲线呈现的是指数级增长而非线性外推。 但值得注意的是,METR 测量的是「AI 能自主工作多久」而非「AI 的工作质量是否可靠」——这两个维度并不等价。一个能连续工作 100 小时的 AI 如果输出质量不稳定,仍然无法真正替代人类研究员。高自主时长和可信度之间存在一个尚未被 benchmark 充分捕捉的鸿沟,这是 Clark 论证链条中一个值得警惕的断点。
在代码、工程和科研三大维度上,SWE-Bench(93.9%)、CORE-Bench(95.5%)、MLE-Bench(Gemini3 达 64.4%)均展现出极快的提升速度。 这些数字的饱和趋势暗示头部模型已在特定 benchmark 上接近人类上限,但 benchmark 的局限性 Clark 本人也承认了——ImageNet 本身有约 6% 的标注错误率,单独某个 benchmark 无法代表真实研发能力。他的方法是「拼马赛克看整体趋势」,这是一种合理但非严谨的论证策略:趋势看对了,但具体概率数字(60%)是如何量化的,外界无从验证。
最关键的技术拐点出现在 PostTrainBench 和 Anthropic 内部数据上。Opus 4.6 实现了 30 倍训练加速,Mythos Preview 达到 52 倍,而人类工程师 4-8 小时只能做到 4 倍。 这个「递归自我改进」的雏形如果持续下去,意味着下一代模型的训练成本将持续下降,形成自我加速的飞轮。但这里的隐忧是:对齐准确率在每一代中都会衰减,Clark 自己给出的计算显示,99.9% 的对齐精度经过 500 代后会衰减至 60.5%。 递归改进越快,对齐衰减的风险就越大,这是一个被 60% 概率乐观叙事掩盖的根本矛盾。
Clark 将 AI 研究定性为「搭积木而非发现相对论」, 认定其本质是 99% 的汗水(debug、scale、tune),而非 1% 的灵感。这个判断在工程化阶段成立,但在范式突破层面存在争议——Transformer 架构、混合专家模型这类结构性创新,并不遵循「更大规模 + 更多调参」的线性逻辑。如果 AI 自动化的边界止步于工程优化而无法触及架构创新,那么 AI 自我构建可能存在一个无法突破的天花板。
最后无法回避的是动机问题。黄仁勋和陶哲轩的批评指向同一个方向:Clark 的预测链条(90% 代码 → 50% 白领岗位 → AI 自我构建)精确地指向「给 Anthropic 更多融资」。 更关键的是,这篇文章发表在 Anthropic 完成新一轮融资之后。对于一个依赖高估值叙事的公司,其技术高管的乐观预测存在结构性偏见。这不是说预测一定错误,而是 60% 这个数字的可信度需要打一个折扣——乐观偏见在商业宣传中是一种系统性偏差。
实践启示¶
-
关注 METR 类自主时长指标,而非单一 benchmark 分数:自主工作时长的提升意味着 AI 能独立承接的任务粒度在变大,这是判断 AI 工程能力逼近临界点的更直观指标,应作为技术选型和路线图规划的重要参考。
-
对齐问题必须与能力提升同步推进,不能假设对齐会自然解决:递归自我改进带来的对齐衰减风险是真实存在的工程挑战,随着 AI 自主研发成为可能,对齐技术的研发速度需要至少与能力提升速度匹配,否则自动化研发系统会成为一个失控加速的闭环。
-
对 AI 研发自动化的乐观预测保持审慎,区分「工程化」与「创新性」边界:AI 在代码、工程任务上接近饱和,但在需要范式级创新的领域仍存疑。制定技术战略时应区分哪些环节可被自动化替代,哪些仍需人类主导——尤其在架构探索和原创性研究方面,不宜过度依赖 AI 自动化叙事。
-
AI 公司的技术预测需要结合商业动机审视,信息来源多元化是必要的风控手段:Anthropic 的预测与其融资节奏的高度相关性是一个值得重视的信号。在制定涉及 AI 自我构建时间线的重大决策时,应交叉验证多个独立信息源,包括学术研究、非利益相关方的技术评估和行业对标数据。
-
关注「机器经济」对劳动力市场和行业竞争格局的结构性影响:Clark 描述的「资本密集、劳动力稀薄」的自主公司形态并非科幻,如果 AI 研发自动化在 2028 年真的实现,拥有算力的实体将在多个行业形成不对称竞争优势,提前理解这一趋势对于个人职业规划和产业政策制定均有参考价值。