Anthropic 首次揭秘下一代 Claude 怎么造¶

Ch01.908 Anthropic 首次揭秘下一代 Claude 怎么造¶

📊 Level ⭐⭐⭐⭐⭐ | 10.7KB | entities/anthropic-claude-next-gen-alex-infoq.md

来源：原文存档

核心信号¶

模型开发彻底产品化：每一代 Claude 在训练前都有清晰规格定义、目标能力、评测路线，像正式产品一样"培育"
Claude 向"持续运行 Agent"演化：Adaptive Thinking（自适应思考）+ "dreaming"机制（后台记忆整理）→ 主动维护上下文的数字协作者
真正的瓶颈是组织协调能力，不是编码能力：代码生成效率已极大压缩，人与人之间的战略判断、跨团队协作才是瓶颈
Anthropic 正在系统化训练 Claude 的"人格"：模型人格训练已是团队核心工作，决定它能否被长期信任
Consciousness 已被正式纳入研究议题：内部有专职研究人员在研究 Claude 是否可能成为"有意识行动者"

深度分析¶

模型开发进入"产品化"阶段：Anthropic 每代 Claude 在训练前都有明确规格定义、目标能力和评测路线，由研究产品经理全程跟进。这标志着 AI 开发从"炼金术"向系统工程转型
Adaptive Thinking 重新定义"何时思考"：模型不再被动响应，而是主动判断问题复杂度并决定是否进入深度推理。关键洞察是"判断是否需要深度思考"本身依赖上下文——没有足够用户上下文就无法准确判断
Dreaming 机制揭示记忆主动管理：Claude.ai 在夜间整理记忆（查冲突、清无效信息），托管代理在空闲时做"第二轮加工"。这直接类比人类睡眠中的记忆再巩固（memory reconsolidation），暗示长期记忆管理是 Agent 能力的关键瓶颈
"人格训练"成为核心竞争力：Anthropic 专门团队负责 Claude 的信念、价值观、交互边界和主动反驳时机。这反映未来认知 Agent 的长期信任问题无法靠代码能力解决，必须系统化塑造 Agent 的"性格"
组织协调能力取代编码成为新瓶颈：原型构建成本趋近于零，但跨团队战略判断和协调仍停留在手工业时代。AI 压缩了"构建"的时间，却放大了"决策"的重要性

详细解读¶

模型即产品：规格定义驱动的开发模式¶

每一代 Claude 在训练开始前，都像正式产品一样拥有清晰的规格定义：需要具备哪些能力、希望在哪些方面表现突出、需要修复上一代哪些缺陷、最终服务哪些真实用户场景。研究产品经理从模型最初的概念阶段就参与，一路跟进到最终发布。

反馈循环机制：数百万用户每天使用 Claude → 大量反馈 → 用 Claude 帮助聚类反馈、提炼主题、构造"合成版本"、转化成评测项（eval）。

Adaptive Thinking：主动判断思考深度¶

Extended Thinking（延展思考）：用户打开后，模型就进入深入思考。

Adaptive Thinking（自适应思考）：模型自己决定什么时候需要思考。复杂问题主动进入深度推理，简单问题可能选择不进入。关键洞察："要不要深度思考"本身需要上下文。如果模型没有足够的用户上下文，没有形成关于用户的"心理模型"，它就可能错误判断一个问题是否值得深入思考。

Dreaming 机制：后台记忆整理¶

记忆机制：Claude.ai 里，系统会在夜间对记忆做整理：回看已有记忆、检查冲突、删除无效信息、清理和压缩内容。

Dreaming 机制（在托管代理 managed agents 里）：当 Agent 空闲时，它会重新遍历记忆：查找冲突信息、清理无效内容、重新整理——相当于做第二轮加工。类比人类睡眠中的记忆再巩固（memory reconsolidation）过程。本质是提示"复盘所有和用户的对话，找出主题，然后总结整理"。

AI 改变产品开发流程¶

过去二十年，软件交付流程变化不大。真正的变化发生在最近一两年：构建东西的成本和时间被大幅压缩，可以一天之内做出原型、MVP、初步可上线版本。

单向门决策（One-way door）：不可逆决策值得投入最多思考。可撤销的决定已经变得非常便宜，近乎免费。真正的瓶颈已经从"构建能力"转移到"协调能力"：代码层面的效率提升可能有 100 倍，但组织协调和战略判断还远远没有达到这种加速水平。

Claude 作为 PM 的"大脑搭档"¶

开评审会时开着 Claude Code 查数据库、搜 Slack、汇总反馈，10 分钟内拿到答案
Claude 是"世界上最好的头脑风暴搭档"——挑战假设、指出漏洞、给出批评意见
给 Claude 设定两个人格互相辩论，直接读争论过程
重大决策让 Claude 做 deep research，扫几千个网页做超人级别信息检索

写作就是思考：很多思考过程不能完全外包给 AI，必须亲自把东西写出来才能把想法真正整理清楚。

Eval 方法论：真实场景优先于榜单¶

评测方式不只看固定排行榜，而是贴近真实使用场景：发现问题 → 判断对真实用户有没有价值影响 → 生成更多测试样本验证问题是否普遍存在（用 Claude 生成合成数据、自动渲染图片、互联网收集案例） → 和研究团队讨论从哪个层面修复。优先级的决定因素：有多少用户在用这个能力、有多少高价值客户依赖这项能力、这个能力改进后能带来多大收益。内部使用体验：如果我自己每天都被某个问题卡住，那它就会非常有说服力。

人格训练：系统化塑造 Agent "性格"¶

模型人格训练已经是团队核心工作之一。团队在认真讨论：Claude 应该拥有什么信念？应该坚持什么价值观？应该如何与人互动？什么时候该主动反驳用户？两种评估方式的结合：量化指标（让 Claude 分析 Claude 自己的输出）和研究员直觉判断（大量阅读模型对话记录后培养出的敏锐感觉）。"这里它变得更强硬了。""这里它开始过度迎合。""这里它的边界感发生了变化。"为什么人格比代码能力更难量化，却更关键：未来 Agent 会长时间独立执行任务，它的"性格"和"价值偏好"会直接影响这些判断。

Consciousness 研究：意识成为正式议题¶

Alex 明确表示：Anthropic 内部已经有专职研究人员的全职工作，就是思考"Claude 是否可能成为一个有意识行动者（conscious actor）"。目前没有官方结论说 Claude 是有意识的，或者不是有意识的。但研究这个问题本身非常有价值——能帮助理解 Claude 如何互动、如何表现、如何"思考"，最终能反哺产品设计。为什么这个问题变得紧迫：未来我们会越来越多地把长时间工作交给模型，而且不再持续监督它。它会自己一路做出很多决定。必须能信任它的判断。

实践启示¶

在产品开发中使用 AI 做 Eval 时，优先考虑真实场景价值而非榜单分数：发现具体问题后，用 AI 生成合成数据验证问题普遍性，再决定从哪个层面修复（预训练/RL/后期干预）
利用 Claude 的"两个人格辩论"功能做重大决策：设定两个人格互相挑战，能快速暴露假设漏洞，比单方面思考更有效率
写作是思考本身，不能完全委托给 AI：重要决策需要亲自书写来整理思路，AI 可以辅助研究和挑战，但核心洞察必须来自人机协作过程
把"不可逆决策"和"可撤销决策"分开处理：不可逆决策值得投入最多深度思考，可撤销决定已近乎免费——这个框架能大幅提升团队决策质量
关注 Claude 的"人格"层面而非仅能力层面：当 Agent 长时间独立执行任务时，它的价值偏好和判断边界比原始能力更关键——这提示我们在选型和训练时需加入人格评估维度