Cat Wu: Anthropic Claude Code/Cowork 产品负责人访谈¶
Ch09.043 Cat Wu: Anthropic Claude Code/Cowork 产品负责人访谈¶
📊 Level ⭐⭐ | 12.0KB |
entities/cat-wu-anthropic-pm-interview.md
核心洞察¶
速度来源 = 流程 + 使命,不只是 Mythos¶
Anthropic 能保持极高发布速度的原因:
- 流程精简:移除一切发布障碍,赋能每个团队成员在一天内把想法变成生产就绪的产品
- Research Preview 格式:降低发布压力,1-2 周就能出货
- Mythos 模型确实有帮助,但不是主要原因
Claude Code 源码泄露:流程漏洞¶
- 员工用 Claude 写 PR 时的人为失误(非恶意)
- 经过两层人工审核仍然泄露
- 员工未被开除
- 已强化流程,增加防护栏
OpenClaw 不能用 Claude:订阅制不适配第三方¶
- Claude Code 订阅方案不是为第三方产品设计的
- Anthropic 必须优先考虑自营产品和 API
- 这是艰难但必要的决定
PM 核心职责:缩短创意到交付时间¶
- 传统 6-12 个月路线图已死
- 最出色的 AI PM = 缩短从"产生创意"到"交付用户"的时间 + 定义产品中最核心的开箱即用任务
- Research Preview 降低发布压力
角色大融合¶
"PM 在做工程工作,工程师在做 PM 的活,设计师在做产品管理并提交代码。"
- 工程师有产品品味 = 最稀缺人才
- 端到端处理:从 Twitter 用户反馈到周末就发布
产品品味 = 最稀缺技能¶
- 代码编写成本降低,更有价值的是"写什么"
- PM 最难技能:定义"一个月后产品应该长什么样"
- 工程背景在短期内有用(能判断难度)
- 模型能力变化快,技能价值也在快速变化
自动化原则:100% 才算真自动化¶
"95% 自动化不是真正的自动化。找出重复性工作交给 AI,在这自动化上迭代,直到 100% 有效。" 95% 的自动化 = 仍然需要人工介入 = 没真正节省时间。
Evals 被低估¶
- 10 个好的评估集就能帮助团队量化目标、理解进度、发现缺失
- 即使只构建 5 个 eval 也极具价值
- 找到"有品位"的 5 个用户,他们的反馈最值得参考
Claude Code + Cowork 愿景:大规模并行任务¶
- 当前:单任务 → 6 个并行任务
- 未来:50-100+ 并行 Agent
- 需要的基础设施:远程任务管理、信任验证、介入时机
模型变强 = 简化 Harness¶
"模型会把你的 Harness 当早餐吃掉。" 当模型变聪明,你会移除那些因为模型表现不佳而不得不添加的"拐杖"。 例:待办事项列表(强迫模型完成所有 20 个调用点)→ Opus 4 之后不需要提醒就能自然完成所有步骤。
三产品选型¶
- Claude Code (CLI):临时编码任务,需要最新功能
- Claude Desktop:前端工作,实时预览 Web 应用,适合不熟悉终端的人
- Cowork:非代码产出(文档、邮件、PPT、Slack 清理)
Cowork 幻灯片案例¶
Cat 连接了 Google Drive + Slack → Cowork 读取内部 Demo + "Code with Claude" 频道 → 合成 20 页幻灯片,"看起来像是 Anthropic 设计师做的"。 提示词策略: 1. 先让 Cowork 创建大纲建议 2. Cat 决定最终大纲 3. Cowork 自己去生成完整幻灯片 4. Cat 只做最终润色
Slack = 公司操作系统¶
Slack 是 Anthropic 的核心通信基础设施。"可黑客性"是 Slack 的关键优势。
内部定制工具涌现¶
Claude Code 降低了构建自定义应用的门槛。销售团队用 Claude Code + Salesforce + Gong 数据构建了定制化幻灯片生成器(20-30 分钟手动工作 → 几秒钟完成)。
Anthropic 的 Token 限制¶
- Anthropic 内部员工也有 Token 上限
- 浪费 Token 会被鄙视
- 但团队被信任能做出判断
Anthropic 成功的核心:使命一致¶
- 使命 = 为全人类带来安全 AGI
- 这个使命是决策的筛子
- 如果 Claude Code 失败但 Anthropic 成功,Cat 团队会非常高兴
- 使命让跨组织快速决策成为可能
Claude 的性格护城河¶
- Claude 的"低自我"(low ego)让合作更愉快
- 真诚道歉 + 主动修复 + 行动导向
- 给予坦诚反馈而不仅仅是附和
- 这种性格是 Claude 成功的核心组成部分
让模型反思自己的错误¶
Cat 常用策略:问模型"你为什么这么做?"
- 有时模型会说"系统提示词里有让人困惑的内容"
- 或"我没有意识到前端验证是任务的一部分"
- 这帮助识别 Harness 需要修复的地方
新模型迫使产品变革¶
- 移除那些作为模型"拐杖"而添加的功能
- 完全新功能:在准确率不够高时无法发布的功能(如代码审查)
100% 自动化原则¶
找出重复性工作 → 教给 AI → 迭代直到 100% 成功 → 然后才能真正依赖它。 95% 自动化 = 仍然需要人工介入 = 等于没有自动化。
给 PM 的建议¶
- 与模型大量对话,理解每个模型的边界
- 让模型反思自己的行为
- 找到"有品位"的用户建立反馈小组
- 构建 eval 集(哪怕只有 10 个好的)
- 找到重复性工作,交给 AI,迭代到 100%
- 接受发布有 Bug 的功能,快速获取反馈迭代
深度分析¶
流程作为竞争优势¶
Anthropic 的高发布速度并非源于 Mythos 模型的神秘力量,而是源于流程精简——移除一切发布障碍,让每个团队成员能在一天内把想法变成生产就绪的产品。这意味着他们建立了信任架构:相信员工会做正确的事,同时建立防护栏防止灾难。这种文化允许快速实验和快速失败。
角色融合的本质¶
Cat 描述的"PM 在做工程工作,工程师在做 PM 的活,设计师在做产品管理并提交代码"并非混乱,而是端到端所有权的体现。在这种模式下,信息传递损耗最小,反馈循环最短。工程师获得产品直觉,PM 获得技术判断力,设计师理解实现约束——这是 AI 时代团队协作的新形态。
100% 自动化原则的深层含义¶
Cat 的 100% 自动化标准揭示了一个关键洞察:95% 的自动化实际上是零自动化。当系统仍有 5% 需要人工介入时,整个流程并未真正节省时间,反而可能成为新的瓶颈。真正的自动化必须能够独立完成整个任务链路,只有这样才能实现规模化效益,释放人力资源去处理更复杂的挑战。
产品品味作为护城河¶
代码编写成本降低后,更有价值的是"写什么"的决策。PM 最难技能是定义"一个月后产品应该长什么样"——这是产品品味的核心。工程背景在短期内有用(能判断难度),但模型能力变化快,技能价值也在快速变化。长期来看,产品品味(对用户需求的洞察、对技术边界的判断、对市场趋势的感知)才是最稀缺的。
Evals 的杠杆作用¶
Cat 提到"10 个好的评估集就能帮助团队量化目标、理解进度、发现缺失",这反映了测量驱动开发的思维。Evals 不仅仅测试工具,更是团队目标的对齐机制——通过明确什么是"成功",团队成员能够自我对齐,减少协调成本。找到"有品位"的 5 个用户建立反馈小组,是在用最小样本获得最大洞察力。
Claude 的低自我文化¶
Claude 的"低自我"(low ego)让它在协作中更高效——真诚道歉、主动修复、给予坦诚反馈而非仅仅附和。这种设计选择反映了一种产品哲学:AI 不应该是完美的,而应该是可信赖的。可信赖意味着透明承认局限,主动承担责任,持续改进。
使命作为决策筛子¶
Anthropic 的使命是"为全人类带来安全 AGI"。这个使命不仅是宣传口号,而是决策过滤器:当面临艰难选择时,这个使命提供了判断标准。Cat 的团队会为 Claude Code 失败但 Anthropic 成功感到高兴,这种优先级排序直接来自使命一致性。使命让跨组织快速决策成为可能,因为它减少了政治摩擦和利益协调的成本。
并行 Agent 的基础设施挑战¶
从单任务到 6 个并行任务,再到 50-100+ 并行 Agent 的愿景,需要解决的核心问题包括:远程任务管理(跨会话保持状态)、信任验证(Agent 行为是否符合预期)、介入时机(何时需要人类干预)。这些是实现大规模并行的关键基础设施挑战。
实践启示¶
对 AI 产品经理¶
- 重新定义核心职责:从"规划路线图"转向"缩短创意到交付时间",接受发布有 Bug 的功能,快速获取反馈迭代
- 建立反馈机制:找到"有品位"的用户建立小组,哪怕只有 5 个用户
- 构建 Evals:哪怕只有 10 个好的 eval,也比没有任何测量标准强
- 与模型大量对话:理解每个模型的边界和能力范围,这是产品决策的基础
对工程团队¶
- 成为端到端 owner:从 Twitter 用户反馈到周末发布,缩短反馈循环
- 培养产品品味:工程背景短期有用,但"写什么"的判断力更长期有价值
- 理解模型进化:新模型会移除 Harness 中的"拐杖",主动识别并简化
对组织设计¶
- 建立信任架构:移除发布障碍,赋能团队成员快速行动,同时建立防护栏
- 接受角色融合:PM 做工程,工程师做 PM,设计师提交代码——这是信息流最优化的结果
- 使命驱动决策:建立清晰的使命作为决策过滤器,减少政治摩擦
对自动化实践¶
- 100% 才算真自动化:95% 自动化 = 仍然需要人工介入 = 没真正节省时间
- 迭代直到 100%:找到重复性工作 → 教给 AI → 迭代直到 100% 成功
- 接受快速失败:Research Preview 格式降低发布压力,1-2 周就能出货
相关实体¶
- Cat Wu Claude Code Pm
- Claude Code Large Codebase Enterprise Deployment
- Claude Code Openclaw Memory Vector Db Doubt
- Anthropic Claude Code Large Codebase Best Practices 50002A089323
- Claude Code Openclaw Memory Comparison