Boris Cherny 新访谈:开发工具正在从 IDE 变成 Agent 控制台¶
Ch01.290 Boris Cherny 新访谈:开发工具正在从 IDE 变成 Agent 控制台¶
📊 Level ⭐⭐ | 12.6KB |
entities/iqSixiNP9lxNKg7aVfHFCQ.md
Boris Cherny 新访谈:开发工具正在从 IDE 变成 Agent 控制台¶
来源:微信公众号"架构师(JiaGouX)"——对 Boris Cherny 在 Sequoia AI Ascent 2026 上访谈的延伸解读 关联文章:Claude Code 源码、Harness、上下文、Skills 系列
→ 原文存档
摘要¶
本文围绕 Boris Cherny(Claude Code 核心创建者之一)在 Sequoia AI Ascent 2026 上的访谈展开,关键论断是:开发工具的中心正从 IDE 里的光标,逐步迁移到管理 Agent 工作流的那块控制台。这不是"AI 写代码更快了"的简单话题,而是软件工程控制点的一次系统性迁移——人从"写代码的人"变成"管 Agent 的人",从控制文件/函数/命令,转向控制目标/约束/权限/预算/验证/审查。
核心要点¶
- "coding is solved"要拆开理解:Boris 说对自己而言 coding 100% solved——但这句话的前提是 Claude Code 主栈 TypeScript/React 在模型最熟悉分布里、且他在 Anthropic 内部有最新工具链。换到 C++/银行核心/嵌入式固件,问题远不只是"代码能不能生成"。
- 治理问题暴露得更早:弱补全工具最多写坏几行;能读仓库、改文件、跑命令、连 Slack、查数据库、修 CI、开 PR 的 Agent 已不是普通插件,而是新的工程参与者。问题不再是"模型会不会写代码",而是"它在什么边界里写、怎么知道写对、错了怎么停下来"。
- 工具的中心位移:Anthropic 对 Claude Code 的官方定位是
agentic coding system——它不是"猜下一行",而是"在一个真实工作空间里行动"。 - 控制点变化:旧路径是"人理解需求→打开文件→写代码→跑测试→修 bug→提交 PR";新路径是"人定义目标→Agent 读上下文→制定计划→改代码→跑测试→根据失败修→人审查 diff/命令/风险→决定合并"。
- "程序员变成管理 Agent"的说法部分对,但不够准确:更准确的说法是"软件开发的交互界面从编辑器交互变成工作流控制"。
- Loop 是关键概念:它让 Agent 从"一次回答"变成"持续观察、执行、修复和汇报的工作进程"。
- 产品悬置(Product Pendulum):Claude Code 的爆发不像传统 SaaS 一步步验证需求,而是"先赌模型能力越过某个点,提前把产品形态放在那里"——前半年不好用不代表方向错,等模型能力上来,原本超前的交互突然就成立了。
- 印刷术类比:构建软件成本下降后,软件创造从少数人专业技能变成更多人基础能力——但写作没有因印刷术消失,编辑、出版、版权、审查反而变复杂。软件也类似:代码更容易生成后,系统设计、质量控制、责任边界会更重要。
深度分析¶
1. 产品悬置(Product Pendulum)—— 不是 PMF 失败,而是时间错位¶
Claude Code 的爆发曲线违反直觉:前半年几乎没有 PMF(Product-Market Fit),但 Opus 4 之后曲线突然起飞。 这与传统 SaaS"一步步验证需求、慢慢打磨 PMF"的路径完全不同。
"产品悬置"概念:
产品形态先于能力溢出被设计出来,"放在那里等着"。前半年不好用不代表方向错——等模型能力越过临界点,原本超前的交互突然就成立了。
这一思维模型对 Agent 产品开发的指导意义: - 不要用短期指标评估前沿 Agent 产品——前半年用户流失和留存数据可能完全误导。 - 关注"能力溢出曲线"——比模型基准测试更重要的是能力何时跨过特定场景门槛。 - 产品形态可以提前"押注"——即便当前模型不够用,产品形态本身已具备未来意义。
2. 控制点迁移 —— 从编辑器交互到工作流控制¶
这是本文最核心的论断。"软件开发的交互界面,正在从编辑器交互,变成工作流控制。"
控制点的具体变化:
旧控制对象 → 新控制对象: - 文件、函数、光标 → 目标、约束、权限、预算、验证、审查 - 代码作者是"人" → 代码作者是"Agent",审查者是"人" - 实时响应(小补全)→ 长任务执行(小时级 multi-step loop)
这与 Harness Engineering Core Patterns 中"控制面应当外置给人类"的工程原则一致——Human-in-the-Loop 不是降级方案,而是 Agent 系统设计的核心约束。
3. "coding is solved"的前提条件分析¶
Boris 自己承认"对自己而言 coding 100% solved",但这个判断有严格的前提。
成立条件:
- 模型最熟悉的主栈:Claude Code 自己的代码库主栈是 TypeScript 和 React,正好踩在模型最熟悉的分布里。
- 最新工具链:在 Anthropic 内部用着最新模型、最新工具、最新流程。
- 团队围绕 Claude Code 重构:整个团队工作方式都是围着 Claude Code 重新搭建。
不成立的场景:
- 跑了三十年的 C++ 系统
- 强合规的银行核心
- 嵌入式固件项目
- 上线窗口非常窄的生产系统
对这些场景,问题不只是"代码能不能生成",还包括: - 历史设计为什么是今天这样 - 哪些边界不能动 - 变更怎么过审 - 数据风险怎么隔离 - 失败以后谁来负责 - 线上事故怎么回滚 - 审计记录怎么留下来
更保守的表述:代码生成正在快速变便宜,软件工程没有因此变简单。很多时候反而反过来的——Agent 能做的越多,治理问题暴露得越早。
4. 印刷术类比的工程含义¶
Boris 用印刷术做类比:构建软件成本下降,软件创造从少数人专业技能变成更多人基础能力。 但关键洞见是:
印刷术普及之后,写作没有消失,编辑、出版、版权和审查反而变复杂了。软件也类似,代码更容易生成之后,系统设计、质量控制和责任边界会更重要。
这一类比揭示了 Agent 时代软件工程的真正稀缺资源:不是代码生成能力,而是软件工程的"上层建筑"——架构、合规、运维、审计、责任归属。
5. Loop 概念:Agent 从一次性回答到持续工作进程¶
Boris 谈到的"Loop"概念值得专门关注:"它让 Agent 从一次回答,变成持续观察、执行、修复和汇报的工作进程。"
Loop 与传统 Agent 调用的区别: - 传统调用:用户请求 → Agent 一次性回答 → 结束 - Loop 模式:用户定义目标 → Agent 持续观察 → 执行任务 → 检测失败 → 自动修复 → 汇报进展 → 继续循环,直到目标达成或失败不可恢复
这与 Claude Code Harness 深度解析 中的 harness 设计哲学一致——harness 的核心价值就是为 Agent 提供持续运行的工程环境,而非一次性对话界面。
6. 治理边界问题的工程框架¶
对于"能读仓库、改文件、跑命令、连 Slack、查数据库、修 CI、开 PR"的 Agent,工程问题框架应当包含:
- 目标层:用户如何清晰表达期望结果
- 边界层:哪些操作被允许,哪些必须人工审批
- 验证层:怎么知道结果是对的(不是"看起来对")
- 回滚层:出错如何快速恢复(不仅是 undo,还包括数据/状态恢复)
- 审计层:所有动作的完整记录
- 责任层:失败的归属与决策追溯
这些边界问题在 Agent 记忆系统工程实践 中被称为"过程资产"——Agent 系统不仅要完成任务,还要留下可审查、可重放、可学习的中间表示。
7. 与 Karpathy Software 3.0 的呼应¶
同一场大会 Karpathy 演讲从另一个角度说了同一件事:"执行层被模型快速突破之后,方向层反而更难了。"
两场演讲的合流:
- Karpathy(理论侧):Software 3.0——执行层自动化后,方向层变得更重要
- Boris(工程侧):控制点迁移——人从写代码的人变成管 Agent 工作流的人
这与 Karpathy Vibe Coding 到 Agentic Engineering 中的论述相互印证——"Vibe Coding"是 Agent 时代的临时形态,"Agentic Engineering"才是稳定形态。
实践启示¶
1. 重新评估 Agent 产品的成熟度¶
不要用短期指标评估前沿 Agent 产品,关注: - 能力溢出曲线(何时跨过特定场景门槛) - 产品形态的"未来意义"(即使当前模型不够用) - 控制面的人机分工是否清晰
2. 重构开发流程以匹配新的控制点¶
如果你的团队正在采用 Claude Code 类 Agent 工具,需要重新设计: - 目标表达规范:从"详细指令"转向"清晰目标 + 边界约束" - 审批节点:从"实时 review"转向"风险点授权" - 验证机制:从"测试通过"转向"端到端正确性证明" - 审计能力:所有 Agent 动作的全链路记录
3. 区分"代码生成"与"软件工程"¶
不要把"Agent 能写代码"等同于"软件工程变简单": - 代码生成是表层能力 - 软件工程的核心矛盾从未改变——理解需求、控制风险、确保质量、承担责任 - Agent 时代这些矛盾反而更突出
4. 拥抱 Loop 模式¶
把一次性对话调用升级为 Loop 模式: - 定义清晰的"完成条件" - 设计状态保持机制(让 Agent 知道任务进行到哪一步) - 实现自动失败检测与修复路径 - 建立定期汇报机制
5. 为"产品悬置"做心理与资源准备¶
如果你的产品依赖模型能力溢出曲线: - 准备好在"前半年不好用"的阶段坚持投入 - 设计"能力阶梯"——每个模型版本都对应一个可用的产品价值 - 在内部建立"产品形态先于能力成熟"的共识
6. 工程治理投资应与代码生成能力同步¶
当 Agent 能做越多事情时,治理问题暴露越早: - 把治理边界作为 Agent 系统的一等公民 - 设计时就要考虑:边界、验证、回滚、审计、责任 - 不要等"出事"再补治理框架
相关实体¶
- 两万字详解 Claude Code 源码核心机制
- Claude Code Harness 深度解析
- Claude Code Harness 深度理解
- 深入理解 Claude Code Agent Harness 构建之道
- GSD 上下文管理工具
- Agent 记忆系统工程实践
- Karpathy Vibe Coding 到 Agentic Engineering
- Anthropic 内部实践
- DeepSeek V4 Flash Pro
- 加速 LLM 模型加载与上下文窗口
- 大型表格模型基础