Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Ch01.018 Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

📊 Level ⭐ | 10.2KB | entities/anthropic-联创2028-年实现-ai-自我构建的概率超过-60.md

Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Anthropic 联合创始人 Jack Clark 今天发了一篇重磅长文，声称： ** AI 系统自己迭代改造自己，可能就在两年后。 **

深度分析¶

1. 核心论证的结构与逻辑¶

Jack Clark 的文章并非单纯的乐观预测，而是一套基于公开 benchmark 数据的系统性论证。他的方法论值得关注：不依赖单一指标，而是拼凑多个独立测试的马赛克，从不同角度验证同一趋势。这种做法有其合理性——每个 benchmark 都有缺陷（如 SWE-Bench 最初只有 2% 的基线、ImageNet 约 6% 的标注错误率），但当图表一路向右上方飞升时，噪音被稀释，信号被放大。

从论证结构上看，Clark 采用了"能力阶梯"叙事：从代码（SW E-Bench 2% → 93.9%）到科研（CORE-Bench 21.5% → 95.5%）到自我训练（PostTrainBench 接近人类基线 51% 的一半）到自我管理（Claude Code 多 Agent 协调），层层递进。最后他给出了一个"积木 vs 相对论"的二元框架，将 AI 研究的本质定性为前者——99% 的汗水 + 1% 的灵感——从而为自动化工程可行性背书。

2. 数据可信度与隐藏假设¶

几个关键数据点值得审视：

METR 自主工作时长曲线从 30 秒（GPT-3.5, 2022）膨胀到 100 小时（预计 2026 年底），这个外推是否可靠？Clark 本人也承认这是"委托工作的前提：相信对方的能力 + 相信对方能在不被盯着的情况下按你的意思干活"——而这第二条恰恰是当前 AI 的薄弱环节。幻觉、上下文漂移、长期任务中的累积误差等问题并未在 METR 曲线中得到体现。

Anthropic 内部训练加速数据（2.9x → 52x，2025 年 5 月到 2026 年 4 月）看似惊人，但这是特定场景下的结果——用 AI 优化 LLM 训练过程本身，属于高度结构化的任务。能否泛化到通用 AI 研究，存疑。

"60% 概率"这个数字本身是一个主观判断，Clark 坦承完全基于公开可查资料且没有动用 Anthropic 内部信息。但这个数字背后有多少是数据分析的结果，有多少是行业叙事的需求，值得存疑。

3. 对立观点的实质¶

文章花了不少篇幅讨论 Jensen Huang 和陶哲轩的批评，但批评的角度其实截然不同：

黄仁勋的批评是工程实践层面的："说服毕业生不要学软件工程是有害的"——他在说 AI 还不能替代工程师，AI 公司高估了技术成熟度。
陶哲轩的批评是经济和商业模型层面的：AI 大公司的商业模式依赖炒作支撑高估值，"希望一两年内会有更理性的重新估值"——他在说这不是技术问题，而是资本叙事问题。

两人批评的对象其实不完全是 Clark 的技术论证，而是这些预测被如何利用的问题。

4. 递归自我改进的风险图景¶

Clark 花了相当篇幅讨论"如果成真"的后果：对齐问题指数放大（99.9% 准确率 × 500 代 → 60.5%）、"机器经济"浮现、完全自主 AI 公司出现。这些判断本身并不新颖，但 Clark 的独特之处在于他没有回避这些风险，反而将它们纳入论证——似乎在说：我知道风险，但数据趋势不可忽视。

这与 Anthropic 作为"安全公司"的人设高度吻合：通过宣称技术即将到来来证明安全研究的紧迫性，同时通过承认风险来强化自身定位。

5. 时间线的政治经济学¶

值得注意的一个细节：Clark 的文章发表在 Anthropic 刚刚完成新一轮融资之后。这不是巧合。从"AI 能写 90% 代码"到"消灭 50% 白领岗位"到"20% 概率毁灭人类"再到"两年内自我构建"——陶哲轩所谓"预言漏斗"（Prophecy Funnel）揭示了一个清晰的融资叙事结构：每条预言都指向同一个方向：请给 Anthropic 更多的钱。

然而，这并不意味着 Clark 的技术判断是错误的。资本动机和客观趋势可能同时为真。

实践启示¶

1. 对 AI 研究者和工程师¶

Benchmark 饱和速度正在加快：SWE-Bench 从 2% 到 93.9% 用了不到两年，CORE-Bench 从 21.5% 到 95.5% 同样迅速。如果你所在的领域还没有被这类自动化测试覆盖，那可能意味着机会——谁能建立衡量自己工作的自动化标准，谁就能更早感知 AI 能力的边界。

多 Agent 协作已成现实：Claude Code、OpenCode 等工具已经支持单个 AI Agent 管理多个子 Agent。这意味着中层管理的可替代性正在从制造业向知识工作蔓延。对于个人而言，理解如何有效地将任务分解、分配给 AI Agent，正在成为和编程一样的基础技能。

Kernel 优化是新战场：DeepSeek、Meta、字节跳动、华为都在布局 GPU kernel 自动生成。这个领域有两个特点特别适合 AI：（1）结果容易验证（跑得快不快一测便知）；（2）对整体训练和推理效率影响巨大。掌握 AI 辅助硬件优化能力的工程师将获得显著溢价。

2. 对公司和组织¶

研发流程的 AI 渗透正在跨越临界点：METR 曲线显示 AI 自主工作时长已达 12 小时（2026 年），预计 2026 年底达 100 小时。这意味着一个工程师 + AI 的组合正在能够独立完成此前需要一个团队数周完成的项目周期。公司的研发组织方式可能需要重新设计——更少的监督，更多的异步授权。

自动化对齐的紧迫性：如果 Clark 的预测成真，递归自我改进将在 2028 年后成为现实。但对齐技术会随每一代 AI 衰减（99.9% × 50 代 → 95.12%）。在追求能力进步的同时，对齐投入必须同步甚至超前——否则技术迭代越快，失控风险越高。

警惕"机器经济"的组织设计：Clark 预测可能出现"拥有大量算力但雇员很少"的公司，以及完全自主的 AI 公司相互交易。这不仅是技术问题，也是法律、伦理和治理问题——你的组织准备好与纯 AI 实体进行商业往来了吗？

3. 对政策制定者¶

算力分配将成为核心政策议题：当 AI 加速数字世界运转，物理世界中的瓶颈（临床试验、基础设施建设）将暴露出来。谁能优先获得算力，将决定 AI 红利的分配。算力基础设施的公平可及性，应该被纳入数字包容性政策的讨论框架。

对齐监管需要技术能力：传统的金融、食品、药品监管机构不具备评估 AI 对齐状态的技术能力。建立有技术素养的 AI 监管团队，可能比制定抽象的伦理准则更紧迫且更有效。

就业市场的结构性变革：从"AI 取代部分岗位"到"AI 自我构建"的时间窗口可能只有 2-3 年。劳动力再培训体系的响应速度必须快于技术进步曲线，否则结构性失业将急剧恶化。

4. 对个人¶

"AI 不会取代你，但会用 AI 的人会"正在变成现实：2028 年的时间线意味着现在入行的研究生，毕业后可能面对的市场已经与入学时截然不同。理解 AI 的能力边界，不是为了恐慌，而是为了找到 AI 放大自己价值的切入点。

批判性信息消费变得更重要：无论是 Clark 的 60% 概率、黄仁勋的"荒谬"批评，还是陶哲轩的"泡沫"类比，都可能同时包含真实洞察和叙事目的。独立核实、交叉验证、多元视角，正在成为知识工作者的基础生存技能。

专注"积木"而非等待"相对论"：Clark 的分析框架——AI 研究是 99% 汗水而非 1% 灵感——对于个人职业发展同样适用：与其追逐少数高不确定性的"突破性洞见"，不如系统性地构建 AI 辅助下高效产出"积木"的能力。

Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Ch01.018 Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

Anthropic 联创：2028 年实现 AI 自我构建的概率超过 60%¶

相关实体¶

深度分析¶

1. 核心论证的结构与逻辑¶

2. 数据可信度与隐藏假设¶

3. 对立观点的实质¶

4. 递归自我改进的风险图景¶

5. 时间线的政治经济学¶

实践启示¶

1. 对 AI 研究者和工程师¶

2. 对公司和组织¶

3. 对政策制定者¶

4. 对个人¶