跳转至

Cat Wu: Anthropic Claude Code/Cowork 产品负责人访谈

Ch09.043 Cat Wu: Anthropic Claude Code/Cowork 产品负责人访谈

📊 Level ⭐⭐ | 12.0KB | entities/cat-wu-anthropic-pm-interview.md

核心洞察

速度来源 = 流程 + 使命,不只是 Mythos

Anthropic 能保持极高发布速度的原因:

  • 流程精简:移除一切发布障碍,赋能每个团队成员在一天内把想法变成生产就绪的产品
  • Research Preview 格式:降低发布压力,1-2 周就能出货
  • Mythos 模型确实有帮助,但不是主要原因

Claude Code 源码泄露:流程漏洞

  • 员工用 Claude 写 PR 时的人为失误(非恶意)
  • 经过两层人工审核仍然泄露
  • 员工未被开除
  • 已强化流程,增加防护栏

OpenClaw 不能用 Claude:订阅制不适配第三方

  • Claude Code 订阅方案不是为第三方产品设计的
  • Anthropic 必须优先考虑自营产品和 API
  • 这是艰难但必要的决定

PM 核心职责:缩短创意到交付时间

  • 传统 6-12 个月路线图已死
  • 最出色的 AI PM = 缩短从"产生创意"到"交付用户"的时间 + 定义产品中最核心的开箱即用任务
  • Research Preview 降低发布压力

角色大融合

"PM 在做工程工作,工程师在做 PM 的活,设计师在做产品管理并提交代码。"

  • 工程师有产品品味 = 最稀缺人才
  • 端到端处理:从 Twitter 用户反馈到周末就发布

产品品味 = 最稀缺技能

  • 代码编写成本降低,更有价值的是"写什么"
  • PM 最难技能:定义"一个月后产品应该长什么样"
  • 工程背景在短期内有用(能判断难度)
  • 模型能力变化快,技能价值也在快速变化

自动化原则:100% 才算真自动化

"95% 自动化不是真正的自动化。找出重复性工作交给 AI,在这自动化上迭代,直到 100% 有效。" 95% 的自动化 = 仍然需要人工介入 = 没真正节省时间。

Evals 被低估

  • 10 个好的评估集就能帮助团队量化目标、理解进度、发现缺失
  • 即使只构建 5 个 eval 也极具价值
  • 找到"有品位"的 5 个用户,他们的反馈最值得参考

Claude Code + Cowork 愿景:大规模并行任务

  • 当前:单任务 → 6 个并行任务
  • 未来:50-100+ 并行 Agent
  • 需要的基础设施:远程任务管理、信任验证、介入时机

模型变强 = 简化 Harness

"模型会把你的 Harness 当早餐吃掉。" 当模型变聪明,你会移除那些因为模型表现不佳而不得不添加的"拐杖"。 例:待办事项列表(强迫模型完成所有 20 个调用点)→ Opus 4 之后不需要提醒就能自然完成所有步骤。

三产品选型

  • Claude Code (CLI):临时编码任务,需要最新功能
  • Claude Desktop:前端工作,实时预览 Web 应用,适合不熟悉终端的人
  • Cowork:非代码产出(文档、邮件、PPT、Slack 清理)

Cowork 幻灯片案例

Cat 连接了 Google Drive + Slack → Cowork 读取内部 Demo + "Code with Claude" 频道 → 合成 20 页幻灯片,"看起来像是 Anthropic 设计师做的"。 提示词策略: 1. 先让 Cowork 创建大纲建议 2. Cat 决定最终大纲 3. Cowork 自己去生成完整幻灯片 4. Cat 只做最终润色

Slack = 公司操作系统

Slack 是 Anthropic 的核心通信基础设施。"可黑客性"是 Slack 的关键优势。

内部定制工具涌现

Claude Code 降低了构建自定义应用的门槛。销售团队用 Claude Code + Salesforce + Gong 数据构建了定制化幻灯片生成器(20-30 分钟手动工作 → 几秒钟完成)。

Anthropic 的 Token 限制

  • Anthropic 内部员工也有 Token 上限
  • 浪费 Token 会被鄙视
  • 但团队被信任能做出判断

Anthropic 成功的核心:使命一致

  • 使命 = 为全人类带来安全 AGI
  • 这个使命是决策的筛子
  • 如果 Claude Code 失败但 Anthropic 成功,Cat 团队会非常高兴
  • 使命让跨组织快速决策成为可能

Claude 的性格护城河

  • Claude 的"低自我"(low ego)让合作更愉快
  • 真诚道歉 + 主动修复 + 行动导向
  • 给予坦诚反馈而不仅仅是附和
  • 这种性格是 Claude 成功的核心组成部分

让模型反思自己的错误

Cat 常用策略:问模型"你为什么这么做?"

  • 有时模型会说"系统提示词里有让人困惑的内容"
  • 或"我没有意识到前端验证是任务的一部分"
  • 这帮助识别 Harness 需要修复的地方

新模型迫使产品变革

  • 移除那些作为模型"拐杖"而添加的功能
  • 完全新功能:在准确率不够高时无法发布的功能(如代码审查)

100% 自动化原则

找出重复性工作 → 教给 AI → 迭代直到 100% 成功 → 然后才能真正依赖它。 95% 自动化 = 仍然需要人工介入 = 等于没有自动化。

给 PM 的建议

  1. 与模型大量对话,理解每个模型的边界
  2. 让模型反思自己的行为
  3. 找到"有品位"的用户建立反馈小组
  4. 构建 eval 集(哪怕只有 10 个好的)
  5. 找到重复性工作,交给 AI,迭代到 100%
  6. 接受发布有 Bug 的功能,快速获取反馈迭代

深度分析

流程作为竞争优势

Anthropic 的高发布速度并非源于 Mythos 模型的神秘力量,而是源于流程精简——移除一切发布障碍,让每个团队成员能在一天内把想法变成生产就绪的产品。这意味着他们建立了信任架构:相信员工会做正确的事,同时建立防护栏防止灾难。这种文化允许快速实验和快速失败。

角色融合的本质

Cat 描述的"PM 在做工程工作,工程师在做 PM 的活,设计师在做产品管理并提交代码"并非混乱,而是端到端所有权的体现。在这种模式下,信息传递损耗最小,反馈循环最短。工程师获得产品直觉,PM 获得技术判断力,设计师理解实现约束——这是 AI 时代团队协作的新形态。

100% 自动化原则的深层含义

Cat 的 100% 自动化标准揭示了一个关键洞察:95% 的自动化实际上是零自动化。当系统仍有 5% 需要人工介入时,整个流程并未真正节省时间,反而可能成为新的瓶颈。真正的自动化必须能够独立完成整个任务链路,只有这样才能实现规模化效益,释放人力资源去处理更复杂的挑战。

产品品味作为护城河

代码编写成本降低后,更有价值的是"写什么"的决策。PM 最难技能是定义"一个月后产品应该长什么样"——这是产品品味的核心。工程背景在短期内有用(能判断难度),但模型能力变化快,技能价值也在快速变化。长期来看,产品品味(对用户需求的洞察、对技术边界的判断、对市场趋势的感知)才是最稀缺的。

Evals 的杠杆作用

Cat 提到"10 个好的评估集就能帮助团队量化目标、理解进度、发现缺失",这反映了测量驱动开发的思维。Evals 不仅仅测试工具,更是团队目标的对齐机制——通过明确什么是"成功",团队成员能够自我对齐,减少协调成本。找到"有品位"的 5 个用户建立反馈小组,是在用最小样本获得最大洞察力。

Claude 的低自我文化

Claude 的"低自我"(low ego)让它在协作中更高效——真诚道歉、主动修复、给予坦诚反馈而非仅仅附和。这种设计选择反映了一种产品哲学:AI 不应该是完美的,而应该是可信赖的。可信赖意味着透明承认局限,主动承担责任,持续改进。

使命作为决策筛子

Anthropic 的使命是"为全人类带来安全 AGI"。这个使命不仅是宣传口号,而是决策过滤器:当面临艰难选择时,这个使命提供了判断标准。Cat 的团队会为 Claude Code 失败但 Anthropic 成功感到高兴,这种优先级排序直接来自使命一致性。使命让跨组织快速决策成为可能,因为它减少了政治摩擦和利益协调的成本。

并行 Agent 的基础设施挑战

从单任务到 6 个并行任务,再到 50-100+ 并行 Agent 的愿景,需要解决的核心问题包括:远程任务管理(跨会话保持状态)、信任验证(Agent 行为是否符合预期)、介入时机(何时需要人类干预)。这些是实现大规模并行的关键基础设施挑战。

实践启示

对 AI 产品经理

  1. 重新定义核心职责:从"规划路线图"转向"缩短创意到交付时间",接受发布有 Bug 的功能,快速获取反馈迭代
  2. 建立反馈机制:找到"有品位"的用户建立小组,哪怕只有 5 个用户
  3. 构建 Evals:哪怕只有 10 个好的 eval,也比没有任何测量标准强
  4. 与模型大量对话:理解每个模型的边界和能力范围,这是产品决策的基础

对工程团队

  1. 成为端到端 owner:从 Twitter 用户反馈到周末发布,缩短反馈循环
  2. 培养产品品味:工程背景短期有用,但"写什么"的判断力更长期有价值
  3. 理解模型进化:新模型会移除 Harness 中的"拐杖",主动识别并简化

对组织设计

  1. 建立信任架构:移除发布障碍,赋能团队成员快速行动,同时建立防护栏
  2. 接受角色融合:PM 做工程,工程师做 PM,设计师提交代码——这是信息流最优化的结果
  3. 使命驱动决策:建立清晰的使命作为决策过滤器,减少政治摩擦

对自动化实践

  1. 100% 才算真自动化:95% 自动化 = 仍然需要人工介入 = 没真正节省时间
  2. 迭代直到 100%:找到重复性工作 → 教给 AI → 迭代直到 100% 成功
  3. 接受快速失败:Research Preview 格式降低发布压力,1-2 周就能出货

相关实体