跳转至

Anthropic 联创:2028 年实现 AI 自我构建的概率超过 60%

Ch01.018 Anthropic 联创:2028 年实现 AI 自我构建的概率超过 60%

📊 Level ⭐ | 10.2KB | entities/anthropic-联创2028-年实现-ai-自我构建的概率超过-60.md

Anthropic 联创:2028 年实现 AI 自我构建的概率超过 60%

Anthropic 联合创始人 Jack Clark 今天发了一篇重磅长文,声称: ** AI 系统自己迭代改造自己,可能就在两年后。 **

相关实体

原文存档

深度分析

1. 核心论证的结构与逻辑

Jack Clark 的文章并非单纯的乐观预测,而是一套基于公开 benchmark 数据的系统性论证。他的方法论值得关注:不依赖单一指标,而是拼凑多个独立测试的马赛克,从不同角度验证同一趋势。这种做法有其合理性——每个 benchmark 都有缺陷(如 SWE-Bench 最初只有 2% 的基线、ImageNet 约 6% 的标注错误率),但当图表一路向右上方飞升时,噪音被稀释,信号被放大。

从论证结构上看,Clark 采用了"能力阶梯"叙事:从代码(SW E-Bench 2% → 93.9%)到科研(CORE-Bench 21.5% → 95.5%)到自我训练(PostTrainBench 接近人类基线 51% 的一半)到自我管理(Claude Code 多 Agent 协调),层层递进。最后他给出了一个"积木 vs 相对论"的二元框架,将 AI 研究的本质定性为前者——99% 的汗水 + 1% 的灵感——从而为自动化工程可行性背书。

2. 数据可信度与隐藏假设

几个关键数据点值得审视:

METR 自主工作时长曲线从 30 秒(GPT-3.5, 2022)膨胀到 100 小时(预计 2026 年底),这个外推是否可靠?Clark 本人也承认这是"委托工作的前提:相信对方的能力 + 相信对方能在不被盯着的情况下按你的意思干活"——而这第二条恰恰是当前 AI 的薄弱环节。幻觉、上下文漂移、长期任务中的累积误差等问题并未在 METR 曲线中得到体现。

Anthropic 内部训练加速数据(2.9x → 52x,2025 年 5 月到 2026 年 4 月)看似惊人,但这是特定场景下的结果——用 AI 优化 LLM 训练过程本身,属于高度结构化的任务。能否泛化到通用 AI 研究,存疑。

"60% 概率"这个数字本身是一个主观判断,Clark 坦承完全基于公开可查资料且没有动用 Anthropic 内部信息。但这个数字背后有多少是数据分析的结果,有多少是行业叙事的需求,值得存疑。

3. 对立观点的实质

文章花了不少篇幅讨论 Jensen Huang 和陶哲轩的批评,但批评的角度其实截然不同:

  • 黄仁勋的批评是工程实践层面的:"说服毕业生不要学软件工程是有害的"——他在说 AI 还不能替代工程师,AI 公司高估了技术成熟度。
  • 陶哲轩的批评是经济和商业模型层面的:AI 大公司的商业模式依赖炒作支撑高估值,"希望一两年内会有更理性的重新估值"——他在说这不是技术问题,而是资本叙事问题。

两人批评的对象其实不完全是 Clark 的技术论证,而是这些预测被如何利用的问题。

4. 递归自我改进的风险图景

Clark 花了相当篇幅讨论"如果成真"的后果:对齐问题指数放大(99.9% 准确率 × 500 代 → 60.5%)、"机器经济"浮现、完全自主 AI 公司出现。这些判断本身并不新颖,但 Clark 的独特之处在于他没有回避这些风险,反而将它们纳入论证——似乎在说:我知道风险,但数据趋势不可忽视。

这与 Anthropic 作为"安全公司"的人设高度吻合:通过宣称技术即将到来来证明安全研究的紧迫性,同时通过承认风险来强化自身定位

5. 时间线的政治经济学

值得注意的一个细节:Clark 的文章发表在 Anthropic 刚刚完成新一轮融资之后。这不是巧合。从"AI 能写 90% 代码"到"消灭 50% 白领岗位"到"20% 概率毁灭人类"再到"两年内自我构建"——陶哲轩所谓"预言漏斗"(Prophecy Funnel)揭示了一个清晰的融资叙事结构:每条预言都指向同一个方向:请给 Anthropic 更多的钱

然而,这并不意味着 Clark 的技术判断是错误的。资本动机和客观趋势可能同时为真。

实践启示

1. 对 AI 研究者和工程师

Benchmark 饱和速度正在加快:SWE-Bench 从 2% 到 93.9% 用了不到两年,CORE-Bench 从 21.5% 到 95.5% 同样迅速。如果你所在的领域还没有被这类自动化测试覆盖,那可能意味着机会——谁能建立衡量自己工作的自动化标准,谁就能更早感知 AI 能力的边界

多 Agent 协作已成现实:Claude Code、OpenCode 等工具已经支持单个 AI Agent 管理多个子 Agent。这意味着中层管理的可替代性正在从制造业向知识工作蔓延。对于个人而言,理解如何有效地将任务分解、分配给 AI Agent,正在成为和编程一样的基础技能。

Kernel 优化是新战场:DeepSeek、Meta、字节跳动、华为都在布局 GPU kernel 自动生成。这个领域有两个特点特别适合 AI:(1)结果容易验证(跑得快不快一测便知);(2)对整体训练和推理效率影响巨大。掌握 AI 辅助硬件优化能力的工程师将获得显著溢价

2. 对公司和组织

研发流程的 AI 渗透正在跨越临界点:METR 曲线显示 AI 自主工作时长已达 12 小时(2026 年),预计 2026 年底达 100 小时。这意味着一个工程师 + AI 的组合正在能够独立完成此前需要一个团队数周完成的项目周期。公司的研发组织方式可能需要重新设计——更少的监督,更多的异步授权。

自动化对齐的紧迫性:如果 Clark 的预测成真,递归自我改进将在 2028 年后成为现实。但对齐技术会随每一代 AI 衰减(99.9% × 50 代 → 95.12%)。在追求能力进步的同时,对齐投入必须同步甚至超前——否则技术迭代越快,失控风险越高。

警惕"机器经济"的组织设计:Clark 预测可能出现"拥有大量算力但雇员很少"的公司,以及完全自主的 AI 公司相互交易。这不仅是技术问题,也是法律、伦理和治理问题——你的组织准备好与纯 AI 实体进行商业往来了吗?

3. 对政策制定者

算力分配将成为核心政策议题:当 AI 加速数字世界运转,物理世界中的瓶颈(临床试验、基础设施建设)将暴露出来。谁能优先获得算力,将决定 AI 红利的分配。算力基础设施的公平可及性,应该被纳入数字包容性政策的讨论框架

对齐监管需要技术能力:传统的金融、食品、药品监管机构不具备评估 AI 对齐状态的技术能力。建立有技术素养的 AI 监管团队,可能比制定抽象的伦理准则更紧迫且更有效

就业市场的结构性变革:从"AI 取代部分岗位"到"AI 自我构建"的时间窗口可能只有 2-3 年。劳动力再培训体系的响应速度必须快于技术进步曲线,否则结构性失业将急剧恶化。

4. 对个人

"AI 不会取代你,但会用 AI 的人会"正在变成现实:2028 年的时间线意味着现在入行的研究生,毕业后可能面对的市场已经与入学时截然不同。理解 AI 的能力边界,不是为了恐慌,而是为了找到 AI 放大自己价值的切入点

批判性信息消费变得更重要:无论是 Clark 的 60% 概率、黄仁勋的"荒谬"批评,还是陶哲轩的"泡沫"类比,都可能同时包含真实洞察和叙事目的。独立核实、交叉验证、多元视角,正在成为知识工作者的基础生存技能

专注"积木"而非等待"相对论":Clark 的分析框架——AI 研究是 99% 汗水而非 1% 灵感——对于个人职业发展同样适用:与其追逐少数高不确定性的"突破性洞见",不如系统性地构建 AI 辅助下高效产出"积木"的能力