Boris Cherny — 从 IDE 到 Agent 控制台¶
Ch03.069 Boris Cherny — 从 IDE 到 Agent 控制台¶
📊 Level ⭐⭐ | 11.6KB |
entities/boris-cherny-ide-to-agent-console.md
人物背景¶
Boris Cherny,Claude Code 创始人,Anthropic Agent 产品负责人。在 Sequoia AI Ascent 2026 上发表访谈,主题与 Karpathy 的 Software 3.0 演讲形成呼应——Karpathy 从概念层定义 Agentic Engineering,Boris 从工程实践层给出具体注脚。
核心洞察¶
1. "coding is solved" 需要拆开理解¶
Boris 说 coding 100% solved 是在他特定的上下文中(TypeScript/React + Anthropic 内部最新模型/工具/流程),这个判断不能直接推广到:
- 三十年 C++ 系统
- 强合规银行核心
- 嵌入式固件
- 窄上线窗口的生产系统 这些场景的核心问题是:历史设计约束、变更审批链、数据风险隔离、失败责任归属、线上回滚机制、审计记录留存。代码生成变便宜 ≠ 软件工程变简单。Agent 能做的越多,治理问题暴露得越早。
2. 控制点迁移¶
| 旧路径 | 新路径 |
|---|---|
| 人写代码 | Agent 改代码 |
| 人跑测试 | Agent 运行测试 |
| 人修 bug | Agent 根据失败继续修 |
| 人提交 PR | 人审查 diff、命令、风险 |
| 人决定是否合并 | |
| 关键变化不是代码作者换了,而是人的控制点从文件/函数/光标换成了目标、约束、权限、预算、验证和审查。 |
3. Loop = 长驻 Agent 工作进程¶
普通 AI 对话 = 一次 prompt 一次回答。 Agent Loop = 目标定义 → 定期观察 → 持续执行 → 发现异常 → 尝试修复 → 记录过程 → 关键结果推送 → 人在判断/审批点介入。 这要求 IDE 变成 Agent 工作流的观察台、调度台和审查台(Agent 控制台),而不只是代码编辑器。
4. SaaS 入口重排¶
- 过去:人每天操作 Salesforce/Jira/Notion/Google Docs
- 以后:人只在一个工作台说话,Agent 连接所有后台系统
- MCP/Computer Use:让外部系统变成 Agent 可理解、可调用、可审计、可治理的能力
- 结论:很多 SaaS 不会消失,但会从人的前台入口退到 Agent 的后台能力层
5. Anthropic 真正的领先是组织流程¶
模型升级按周算,组织升级按季度/年算。Boris 提到 Anthropic 内部 Agent 通过 Slack 与其他 Agent 沟通、SQL 和代码都大量由模型生成。但这是组织设计问题,不是模型能力问题。 内部问题清单:哪些任务可交给 Agent 常驻、Agent 能不能直接开 PR、成本预算按人还是按任务算、Loop 跑坏谁有权停掉。
6. 工程师能力迁移¶
从"亲手生产代码" → "拥有系统结果":
- 把含糊需求整理成 Agent 可执行规格
- 把大任务切成互不污染的工作单元
- 判断 Agent 方案是否漏了关键边界
- 设计测试和评估让结果自己说话
- 看懂 diff 背后的架构影响
- 区分哪些动作可自动、哪些需要人工确认
- 把成功经验沉淀成团队 Skill 或 Runbook
7. 与 Karpathy 的线索接上¶
同场 Sequoia AI Ascent 2026,Karpathy 谈 Software 3.0 概念框架,Boris 的访谈在工程实践侧补了具体注脚。 两人共同指向:"你可以外包思考,但你不能外包理解"(Karpathy 语),Boris 的"engineering is changing but great engineers are more important than ever"是同一句话的工程版本。
Boris 原话¶
"Someone has to prompt the Claudes, talk to customers, coordinate with other teams, decide what to build next. Engineering is changing and great engineers are more important than ever." — Boris Cherny,2026年2月 X
深度分析¶
从工具到范式的根本转移¶
Boris Cherny 的访谈揭示了一个被低估的转变:AI 编程工具的本质不是"更聪明的补全",而是交互范式的替换。IDE 从代码编辑器变成 Agent 控制台,这个变化意味着人的角色从"生产者"变成"监督者"和"决策者"。这不是渐进优化,而是交互层的一次断代。
"coding is solved" 的条件性¶
Boris 给出这个判断时有严格的上下文限定:TypeScript/React + Anthropic 内部最新模型/工具/流程。这三件事同时成立才成立。任何一项不满足,结论就不同。历史系统、强合规环境、窄窗口生产——这些场景的核心矛盾不是代码能不能写出来,而是变更的治理链条能不能匹配上代码生成的速度。代码生成变便宜,但制度成本没有变。
Loop 作为核心竞争力¶
Boris 强调的 Loop(长驻 Agent 工作进程)与 Karpathy 谈的"外包思考但不能外包理解"形成对称:Loop 是让 Agent 能够自主持续工作的机制,而人的"理解"是给这个机制定义目标、边界和退出条件的锚点。没有好的人机协同设计,Loop 会变成失控的自动化;有好的设计,Agent 才能成为真正的长期工作伙伴。
Anthropic 的护城河是组织设计¶
模型按周迭代,组织按季度/年迭代。Boris 透露 Anthropic 内部已经有 Agent 通过 Slack 与其他 Agent 沟通——这个场景本身就要求一套全新的组织流程设计。成本核算方式、权限模型、审批节点、故障停机权限……这些制度层面的东西比模型参数的改进更难复制。
实践启示¶
给工程师的建议¶
- 掌握规格化能力:把含糊的业务需求整理成 Agent 可执行的精确规格,是第一层竞争力
- 建立任务切分思维:大任务如何拆成互不污染的工作单元,决定了 Agent 能否真正并行工作
- 强化架构判断力:能看懂 diff 背后的架构影响,能判断 Agent 方案是否漏了关键边界
- 设计验证而非堆功能:测试和评估设计得越好,Agent 的输出质量越能自我证明
- 区分自动化层级:哪些动作可自动、哪些需要人工确认——这个判断力来自一线经验
给组织的建议¶
- 重新定义"工程师":从"代码产出者"到"系统结果拥有者",KPI 和工作流需要重新设计
- 建立 Agent 使用规范:哪些任务可交给常驻 Agent、Agent 能不能直接开 PR、成本怎么算——这些问题早于模型选型
- 投资治理基础设施:MCP/Computer Use 让外部系统变成 Agent 可调用能力,这要求审计、权限、异常处理机制同步到位
- 把成功经验固化:把经过验证的 Agent 工作流沉淀成团队的 Skill 或 Runbook,减少重复试错
给 SaaS 行业的提示¶
前台入口的价值会向少数"工作台"集中。现有 SaaS 不会被消灭,但会从人的前台退到 Agent 的后台能力层。产品的 API 化、可审计性、可被 MCP 调用能力,将成为新的护城河。
参考资料¶
- 访谈视频:https://www.youtube.com/watch?v=SlGRN8jh2RI
- Karpathy Sequoia 演讲:https://karpathy.bearblog.dev/sequoia-ascent-2026/
- Claude Code 产品页:https://www.anthropic.com/product/claude-code
- Claude Code MCP 文档:https://docs.anthropic.com/en/docs/claude-code/mcp
- Simon Willison 转述:https://simonwillison.net/2026/Feb/14/boris/
关联条目¶
- Karpathy Vibe Coding To Agentic Engineering — 同场 Sequoia AI Ascent 2026,Software 3.0 概念框架,Boris 访谈的上一层叙事
- Claude Code Architecture — Claude Code 源码架构,包含主循环、Permission 管道等底层实现
- Cat Wu Claude Code Pm — Anthropic Claude Code/Cowork 产品负责人,同团队视角
- — Karpathy 访谈原文存档
相关实体¶
- Boris Cherny 新访谈:开发工具正在从 IDE 变成 Agent 控制台
- Boris Cherny 新访谈:开发工具正在从 IDE 变成 Agent 控制台
- 深入理解 Claude Code 源码中的 Agent Harness 构建之道
- 两万字详解Claude Code源码核心机制
- Claude Code 源码解析:Skills/MCP/Rules 底层机制对比
- IMClaw:通过微信/飞书操控ClaudeCode/Codex/GeminiCLI/Pi Agent蜂群
- Anthropic 官方技能最佳实践:14 个可复用的 Agent Skills 设计模式
- Claude Code 源码拆解:从启动到多 Agent 扩展层
- Claude Code MCP Server
- Agent 上下文窗口管理对比
- Claude 发布官方报告,承认存在 3 处质量退化问题
- Claude Code 开发负责人:为何放弃 RAG 而选择 Agentic Search
- Harness如何支撑Agent在生产环境稳定运行?
- 刚刚Opus 4.7发布,相比4.6核心变化,与Claude Code搭配最佳实践
- 从Vibe Coding到Agentic Engineering:重构后台开发全流程 — 腾讯技术工程
→ 原文存档