Cat Wu: Anthropic Claude Code/Cowork 产品负责人访谈¶

Ch09.043 Cat Wu: Anthropic Claude Code/Cowork 产品负责人访谈¶

📊 Level ⭐⭐ | 12.0KB | entities/cat-wu-anthropic-pm-interview.md

核心洞察¶

速度来源 = 流程 + 使命，不只是 Mythos¶

Anthropic 能保持极高发布速度的原因：

流程精简：移除一切发布障碍，赋能每个团队成员在一天内把想法变成生产就绪的产品
Research Preview 格式：降低发布压力，1-2 周就能出货
Mythos 模型确实有帮助，但不是主要原因

Claude Code 源码泄露：流程漏洞¶

员工用 Claude 写 PR 时的人为失误（非恶意）
经过两层人工审核仍然泄露
员工未被开除
已强化流程，增加防护栏

OpenClaw 不能用 Claude：订阅制不适配第三方¶

Claude Code 订阅方案不是为第三方产品设计的
Anthropic 必须优先考虑自营产品和 API
这是艰难但必要的决定

PM 核心职责：缩短创意到交付时间¶

传统 6-12 个月路线图已死
最出色的 AI PM = 缩短从"产生创意"到"交付用户"的时间 + 定义产品中最核心的开箱即用任务
Research Preview 降低发布压力

角色大融合¶

"PM 在做工程工作，工程师在做 PM 的活，设计师在做产品管理并提交代码。"

工程师有产品品味 = 最稀缺人才
端到端处理：从 Twitter 用户反馈到周末就发布

产品品味 = 最稀缺技能¶

代码编写成本降低，更有价值的是"写什么"
PM 最难技能：定义"一个月后产品应该长什么样"
工程背景在短期内有用（能判断难度）
模型能力变化快，技能价值也在快速变化

自动化原则：100% 才算真自动化¶

"95% 自动化不是真正的自动化。找出重复性工作交给 AI，在这自动化上迭代，直到 100% 有效。" 95% 的自动化 = 仍然需要人工介入 = 没真正节省时间。

Evals 被低估¶

10 个好的评估集就能帮助团队量化目标、理解进度、发现缺失
即使只构建 5 个 eval 也极具价值
找到"有品位"的 5 个用户，他们的反馈最值得参考

Claude Code + Cowork 愿景：大规模并行任务¶

当前：单任务 → 6 个并行任务
未来：50-100+ 并行 Agent
需要的基础设施：远程任务管理、信任验证、介入时机

模型变强 = 简化 Harness¶

"模型会把你的 Harness 当早餐吃掉。" 当模型变聪明，你会移除那些因为模型表现不佳而不得不添加的"拐杖"。例：待办事项列表（强迫模型完成所有 20 个调用点）→ Opus 4 之后不需要提醒就能自然完成所有步骤。

三产品选型¶

Claude Code (CLI)：临时编码任务，需要最新功能
Claude Desktop：前端工作，实时预览 Web 应用，适合不熟悉终端的人
Cowork：非代码产出（文档、邮件、PPT、Slack 清理）

Cowork 幻灯片案例¶

Cat 连接了 Google Drive + Slack → Cowork 读取内部 Demo + "Code with Claude" 频道 → 合成 20 页幻灯片，"看起来像是 Anthropic 设计师做的"。提示词策略： 1. 先让 Cowork 创建大纲建议 2. Cat 决定最终大纲 3. Cowork 自己去生成完整幻灯片 4. Cat 只做最终润色

Slack = 公司操作系统¶

Slack 是 Anthropic 的核心通信基础设施。"可黑客性"是 Slack 的关键优势。

内部定制工具涌现¶

Claude Code 降低了构建自定义应用的门槛。销售团队用 Claude Code + Salesforce + Gong 数据构建了定制化幻灯片生成器（20-30 分钟手动工作 → 几秒钟完成）。

Anthropic 的 Token 限制¶

Anthropic 内部员工也有 Token 上限
浪费 Token 会被鄙视
但团队被信任能做出判断

Anthropic 成功的核心：使命一致¶

使命 = 为全人类带来安全 AGI
这个使命是决策的筛子
如果 Claude Code 失败但 Anthropic 成功，Cat 团队会非常高兴
使命让跨组织快速决策成为可能

Claude 的性格护城河¶

Claude 的"低自我"（low ego）让合作更愉快
真诚道歉 + 主动修复 + 行动导向
给予坦诚反馈而不仅仅是附和
这种性格是 Claude 成功的核心组成部分

让模型反思自己的错误¶

Cat 常用策略：问模型"你为什么这么做？"

有时模型会说"系统提示词里有让人困惑的内容"
或"我没有意识到前端验证是任务的一部分"
这帮助识别 Harness 需要修复的地方

新模型迫使产品变革¶

移除那些作为模型"拐杖"而添加的功能
完全新功能：在准确率不够高时无法发布的功能（如代码审查）

100% 自动化原则¶

找出重复性工作 → 教给 AI → 迭代直到 100% 成功 → 然后才能真正依赖它。 95% 自动化 = 仍然需要人工介入 = 等于没有自动化。

给 PM 的建议¶

与模型大量对话，理解每个模型的边界
让模型反思自己的行为
找到"有品位"的用户建立反馈小组
构建 eval 集（哪怕只有 10 个好的）
找到重复性工作，交给 AI，迭代到 100%
接受发布有 Bug 的功能，快速获取反馈迭代

深度分析¶

流程作为竞争优势¶

Anthropic 的高发布速度并非源于 Mythos 模型的神秘力量，而是源于流程精简——移除一切发布障碍，让每个团队成员能在一天内把想法变成生产就绪的产品。这意味着他们建立了信任架构：相信员工会做正确的事，同时建立防护栏防止灾难。这种文化允许快速实验和快速失败。

角色融合的本质¶

Cat 描述的"PM 在做工程工作，工程师在做 PM 的活，设计师在做产品管理并提交代码"并非混乱，而是端到端所有权的体现。在这种模式下，信息传递损耗最小，反馈循环最短。工程师获得产品直觉，PM 获得技术判断力，设计师理解实现约束——这是 AI 时代团队协作的新形态。

100% 自动化原则的深层含义¶

Cat 的 100% 自动化标准揭示了一个关键洞察：95% 的自动化实际上是零自动化。当系统仍有 5% 需要人工介入时，整个流程并未真正节省时间，反而可能成为新的瓶颈。真正的自动化必须能够独立完成整个任务链路，只有这样才能实现规模化效益，释放人力资源去处理更复杂的挑战。

产品品味作为护城河¶

代码编写成本降低后，更有价值的是"写什么"的决策。PM 最难技能是定义"一个月后产品应该长什么样"——这是产品品味的核心。工程背景在短期内有用（能判断难度），但模型能力变化快，技能价值也在快速变化。长期来看，产品品味（对用户需求的洞察、对技术边界的判断、对市场趋势的感知）才是最稀缺的。

Evals 的杠杆作用¶

Cat 提到"10 个好的评估集就能帮助团队量化目标、理解进度、发现缺失"，这反映了测量驱动开发的思维。Evals 不仅仅测试工具，更是团队目标的对齐机制——通过明确什么是"成功"，团队成员能够自我对齐，减少协调成本。找到"有品位"的 5 个用户建立反馈小组，是在用最小样本获得最大洞察力。

Claude 的低自我文化¶

Claude 的"低自我"（low ego）让它在协作中更高效——真诚道歉、主动修复、给予坦诚反馈而非仅仅附和。这种设计选择反映了一种产品哲学：AI 不应该是完美的，而应该是可信赖的。可信赖意味着透明承认局限，主动承担责任，持续改进。

使命作为决策筛子¶

Anthropic 的使命是"为全人类带来安全 AGI"。这个使命不仅是宣传口号，而是决策过滤器：当面临艰难选择时，这个使命提供了判断标准。Cat 的团队会为 Claude Code 失败但 Anthropic 成功感到高兴，这种优先级排序直接来自使命一致性。使命让跨组织快速决策成为可能，因为它减少了政治摩擦和利益协调的成本。

并行 Agent 的基础设施挑战¶

从单任务到 6 个并行任务，再到 50-100+ 并行 Agent 的愿景，需要解决的核心问题包括：远程任务管理（跨会话保持状态）、信任验证（Agent 行为是否符合预期）、介入时机（何时需要人类干预）。这些是实现大规模并行的关键基础设施挑战。

实践启示¶

对 AI 产品经理¶

重新定义核心职责：从"规划路线图"转向"缩短创意到交付时间"，接受发布有 Bug 的功能，快速获取反馈迭代
建立反馈机制：找到"有品位"的用户建立小组，哪怕只有 5 个用户
构建 Evals：哪怕只有 10 个好的 eval，也比没有任何测量标准强
与模型大量对话：理解每个模型的边界和能力范围，这是产品决策的基础

对工程团队¶

成为端到端 owner：从 Twitter 用户反馈到周末发布，缩短反馈循环
培养产品品味：工程背景短期有用，但"写什么"的判断力更长期有价值
理解模型进化：新模型会移除 Harness 中的"拐杖"，主动识别并简化

对组织设计¶

建立信任架构：移除发布障碍，赋能团队成员快速行动，同时建立防护栏
接受角色融合：PM 做工程，工程师做 PM，设计师提交代码——这是信息流最优化的结果
使命驱动决策：建立清晰的使命作为决策过滤器，减少政治摩擦

对自动化实践¶

100% 才算真自动化：95% 自动化 = 仍然需要人工介入 = 没真正节省时间
迭代直到 100%：找到重复性工作 → 教给 AI → 迭代直到 100% 成功
接受快速失败：Research Preview 格式降低发布压力，1-2 周就能出货