Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Ch01.069 Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

📊 Level ⭐ | 6.5KB | entities/anthropic联创2028-ai自我构建概率超60.md

Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Anthropic 联合创始人 Jack Clark 今天发了一篇重磅长文，声称： ** AI 系统自己迭代改造自己，可能就在两年后。 ** 他花了几周时间，翻遍了上百个公开数据源，最后给出了一个概率：到 2028 年底，AI 实现端到端自动化研发的概率，已经 ** 超过 60%。 **

“ 我现在相信，我们正生活在 AI 研究将被端到端自动化的时代。这篇文章发在他的 Newsletter「Import AI」第 455 期，标题直接挑明了主题： ** AI 系统即将开始自我构建。 **

深度分析¶

Jack Clark 给出 60% 概率判断的核心支撑，是一套名为 METR 的自主工作时长追踪数据。从 2022 年 GPT-3.5 的 30 秒，到 2026 年 Opus 4.6 的 12 小时，这条曲线呈现的是指数级增长而非线性外推。但值得注意的是，METR 测量的是「AI 能自主工作多久」而非「AI 的工作质量是否可靠」——这两个维度并不等价。一个能连续工作 100 小时的 AI 如果输出质量不稳定，仍然无法真正替代人类研究员。高自主时长和可信度之间存在一个尚未被 benchmark 充分捕捉的鸿沟，这是 Clark 论证链条中一个值得警惕的断点。

在代码、工程和科研三大维度上，SWE-Bench（93.9%）、CORE-Bench（95.5%）、MLE-Bench（Gemini3 达 64.4%）均展现出极快的提升速度。这些数字的饱和趋势暗示头部模型已在特定 benchmark 上接近人类上限，但 benchmark 的局限性 Clark 本人也承认了——ImageNet 本身有约 6% 的标注错误率，单独某个 benchmark 无法代表真实研发能力。他的方法是「拼马赛克看整体趋势」，这是一种合理但非严谨的论证策略：趋势看对了，但具体概率数字（60%）是如何量化的，外界无从验证。

最关键的技术拐点出现在 PostTrainBench 和 Anthropic 内部数据上。Opus 4.6 实现了 30 倍训练加速，Mythos Preview 达到 52 倍，而人类工程师 4-8 小时只能做到 4 倍。这个「递归自我改进」的雏形如果持续下去，意味着下一代模型的训练成本将持续下降，形成自我加速的飞轮。但这里的隐忧是：对齐准确率在每一代中都会衰减，Clark 自己给出的计算显示，99.9% 的对齐精度经过 500 代后会衰减至 60.5%。递归改进越快，对齐衰减的风险就越大，这是一个被 60% 概率乐观叙事掩盖的根本矛盾。

Clark 将 AI 研究定性为「搭积木而非发现相对论」，认定其本质是 99% 的汗水（debug、scale、tune），而非 1% 的灵感。这个判断在工程化阶段成立，但在范式突破层面存在争议——Transformer 架构、混合专家模型这类结构性创新，并不遵循「更大规模 + 更多调参」的线性逻辑。如果 AI 自动化的边界止步于工程优化而无法触及架构创新，那么 AI 自我构建可能存在一个无法突破的天花板。

最后无法回避的是动机问题。黄仁勋和陶哲轩的批评指向同一个方向：Clark 的预测链条（90% 代码 → 50% 白领岗位 → AI 自我构建）精确地指向「给 Anthropic 更多融资」。更关键的是，这篇文章发表在 Anthropic 完成新一轮融资之后。对于一个依赖高估值叙事的公司，其技术高管的乐观预测存在结构性偏见。这不是说预测一定错误，而是 60% 这个数字的可信度需要打一个折扣——乐观偏见在商业宣传中是一种系统性偏差。

实践启示¶

关注 METR 类自主时长指标，而非单一 benchmark 分数：自主工作时长的提升意味着 AI 能独立承接的任务粒度在变大，这是判断 AI 工程能力逼近临界点的更直观指标，应作为技术选型和路线图规划的重要参考。
对齐问题必须与能力提升同步推进，不能假设对齐会自然解决：递归自我改进带来的对齐衰减风险是真实存在的工程挑战，随着 AI 自主研发成为可能，对齐技术的研发速度需要至少与能力提升速度匹配，否则自动化研发系统会成为一个失控加速的闭环。
对 AI 研发自动化的乐观预测保持审慎，区分「工程化」与「创新性」边界：AI 在代码、工程任务上接近饱和，但在需要范式级创新的领域仍存疑。制定技术战略时应区分哪些环节可被自动化替代，哪些仍需人类主导——尤其在架构探索和原创性研究方面，不宜过度依赖 AI 自动化叙事。
AI 公司的技术预测需要结合商业动机审视，信息来源多元化是必要的风控手段：Anthropic 的预测与其融资节奏的高度相关性是一个值得重视的信号。在制定涉及 AI 自我构建时间线的重大决策时，应交叉验证多个独立信息源，包括学术研究、非利益相关方的技术评估和行业对标数据。
关注「机器经济」对劳动力市场和行业竞争格局的结构性影响：Clark 描述的「资本密集、劳动力稀薄」的自主公司形态并非科幻，如果 AI 研发自动化在 2028 年真的实现，拥有算力的实体将在多个行业形成不对称竞争优势，提前理解这一趋势对于个人职业规划和产业政策制定均有参考价值。

Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Ch01.069 Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

相关实体¶

深度分析¶

实践启示¶