跳转至

Karpathy 最新访谈:从 Vibe Coding 到 Agentic Engineering

Ch09.019 Karpathy 最新访谈:从 Vibe Coding 到 Agentic Engineering

📊 Level ⭐⭐ | 16.5KB | entities/karpathy-vibe-coding-agentic-engineering-v3.md

核心观点

Vibe Coding vs Agentic Engineering 的分工

维度 Vibe Coding Agentic Engineering
目标 降低软件创造下限 守住专业软件质量门槛
适用场景 原型、个人工具、低风险探索 生产系统、真实业务、权限/资金/数据
核心挑战 创意到代码的转化效率 上下文、权限、工具、验证、审计、回滚
评价指标 功能能否跑起来 系统是否可控、可验证、可回滚

Software 3.0 的三层架构

  • Software 1.0:人写显式规则,机器按代码执行。核心材料是代码,关注模块、接口、依赖、运行时。
  • Software 2.0:神经网络时代,人设计数据、目标和训练过程,模型权重也变成软件的一部分。核心材料是数据和模型权重。
  • Software 3.0:LLM 作为新的信息处理解释器,人通过提示词、上下文、文件、工具和环境来影响行为。核心材料是上下文、工具、记忆、权限、验证——这些正在变成需要被设计的「软件材料」。

Agent Control Plane 八层框架

Agentic Engineering 的核心是围绕 Agent 构建控制面: | 控制维度 | 主要问题 | |----------|----------| | Context Control | Agent 能看到什么,不能看到什么 | | Spec Control | 任务目标、约束和验收标准如何表达 | | Tool Control | Agent 可以调用哪些工具,调用参数如何约束 | | Permission Control | 哪些动作允许,哪些动作需要审批 | | Runtime Control | 执行环境如何隔离、限额、恢复 | | Verification Control | 结果如何通过测试、编译、规则和评估器验证 | | Audit Control | Agent 做了什么、为什么做、造成什么影响 | | Cost Control | Token、模型调用、工具调用和重试成本如何控制 |

可验证性决定自动化边界

Karpathy 反复强调:传统计算机容易自动化你能写进代码的东西,这一代 LLM 更容易自动化你能验证的东西。代码、数学、测试、编译、结构化任务之所以进展快,核心在于这些领域容易构造反馈信号。 按可验证性划分的任务等级:

  • L1:输出可静态校验 → Agent 适用度高
  • L2:可编译、可测试 → Agent 适用度高
  • L3:可通过集成测试验证 → 较高
  • L4:涉及业务规则与状态变更 → 需要审批和审计
  • L5:涉及资金、身份、权限、数据删除 → 必须强管控
  • L6:涉及组织判断、法律责任、战略选择 → 人必须主导

锯齿状智能与护栏设计

Karpathy 用「锯齿状智能」形容 LLM 的不均匀能力分布。典型例子:最先进的模型可以重构 10 万行代码、找到零日漏洞,却判断不出 50 米外的洗车应该开车去而不是走路(因为要洗的是车本身)。 Simon Willison 的安全框架:当 Agent 同时具备访问私有数据、接触不可信内容、对外通信三种能力时,风险陡然上升。 护栏设计要点:

  • 幻觉执行:工具调用前校验
  • 错误修改代码:分支隔离和代码审查
  • 误删数据:沙箱和只读默认权限
  • 错误部署:灰度、回滚、审批
  • 错误关联身份和资金:稳定 ID 与领域模型约束
  • Prompt Injection:私有数据、不可信输入、外部通信分离
  • 成本失控:Token 限额、调用预算、模型路由
  • 行为不可追溯:全量日志和审计链

幽灵 vs 动物:LLM 的本质

Karpathy 提出:我们不是在造动物,而是在召唤幽灵。LLM 来自大规模预训练,叠加 RL、偏好数据、工具调用后训练过程,更像由人类文档、统计模式和奖励函数塑造的「模拟实体」——没有内在动机、好奇心、持续适应能力,不会因被催促或鼓励而改变行为模式。 这意味着:上下文、权限、工具、验证、审计这些机制不是因 Agent「不够好」才补的,而是 Agent 本来就不是可以直接套用人类管理直觉的对象。

人的位置:细节外包,理解不能外包

你可以外包思考,但不能外包理解。 Karpathy 已不再记 PyTorch/NumPy/pandas 之间细碎的 API 差异,但仍然必须理解 tensor 是什么、view 和 storage 的关系、什么时候会真的复制数据。细节可以外包,理解不能外包。 新型工程师的能力迁移: | 过去重要 | 现在可能更重要 | |----------|----------------| | 熟悉 API 细节 | 理解底层机制 | | 手写业务代码 | 定义业务语义 | | 写脚本自动化 | 设计 Agent 执行边界 | | 完成功能 | 设计验收标准 | | 修 bug | 建立验证体系 | | 控制模块依赖 | 控制 Agent 权限和上下文 | | 管理代码质量 | 管理系统后果 |

Agent Native Infrastructure

今天大部分基础设施还是给人设计的。Agent 时代需要另一套基础设施:

  • Agent-readable Docs:文档从说明材料变成执行材料
  • Tool Registry:Agent 知道有哪些工具可用,如何调用
  • Permission Gateway:控制 Agent 能做什么,不能做什么
  • Execution Sandbox:隔离 Agent 的执行环境和影响范围
  • Verification Pipeline:用测试、规则、评估器验证结果
  • Audit and Cost Ledger:记录 Agent 做了什么、花了多少、造成什么影响

人才评估转向

传统算法题测不出 Agentic Engineering 能力。替代评估方式:给候选人一个极大项目(如做一个给 Agent 用的 Twitter 仿盘,要求绝对安全),然后让 10 个 Cursor 作为红队去攻击。最终看的是:把模糊目标变成清晰规格、指挥多个 Agent 完成大规模实现、识别安全和架构风险、设置测试与验证、在模型生成的大量代码里保住质量判断。

深度分析

范式转变的实质:从工具到系统

Karpathy 一年前提出 Vibe Coding,命名的是一种个人开发体验——用自然语言指挥 AI 生成代码、调整、迭代,核心关注点是「能否快速把想法跑起来」。一年后他转向 Agentic Engineering,这个命名重心从「开发体验」移到了「工程责任」。 这个转变的实质不是术语更新,而是 Agent 在软件工程链路里的渗透深度发生了质变。2025 年底的转折点是可观测的:模型不再只补函数级代码块,开始能接住更大粒度的任务——读上下文、改多文件、调命令、跑测试、基于失败继续修。这意味着 Agent 从「开发工具」变成了「工程链路里的执行节点」。 一旦进入这个位置,问题就从「工具好不好用」变成「系统在全局是否可控」——上下文边界、权限收口、工具调用约束、验证闭环、审计链路,每一个环节缺了都不行,每一个环节出问题都会把模型的不稳定性放大成工程事故。]

可验证性是 Agent 扩张的天花板

Karpathy 的核心论断值得单独拎出来:「传统计算机容易自动化你能写进代码的东西,这一代 LLM 更容易自动化你能验证的东西。」这句话不是修辞,而是对自动化边界的形式化描述。 代码、测试、编译、数学、形式化验证之所以进展快,是因为这些领域能构造出低噪声的反馈信号。Agent 在 L4 及以上开始遇到麻烦,不是因为模型不够聪明,而是因为业务规则、状态变更、资金流转这些领域的反馈信号往往是局部的、延迟的、语义性的——代码能通过编译但业务语义错了,测试能跑过但用户身份建模偏了。这类错误需要人介入校验,本质上是验证体系缺位,而不是执行能力不足。 这意味着 Agent 能力要继续往高风险领域扩张,不是靠更强的模型自动解决,而是靠更完善的验证基础设施先把反馈信号建立起来。]

Software 3.0 的架构含义

Software 1.0 的核心材料是代码,架构关注模块、接口、依赖和运行时。Software 2.0 的核心材料是数据与模型权重,关注训练过程和评估指标。Software 3.0 把上下文、工具、记忆、权限、验证一起拉进了「软件材料」的范畴——这些过去被视为运行时环境附件的东西,正在变成需要被设计的对象。 这个变化对架构工作的直接影响是:除了「模块 A 和模块 B 是什么关系」,现在还要回答「Agent 和系统之间是什么关系」——它能读哪些文档、改哪些文件、调哪些 API、执行哪些命令,输出怎么验证,失败怎么隔离,行为怎么追踪。这不是给 IDE 加个聊天框能解决的事,是整条研发链路的控制面重新设计。]

幽灵比喻的工程推论

Karpathy 用「召唤幽灵」而不是「制造动物」来形容 LLM,这个比喻的工程价值在于:它让人放弃用人类管理直觉去套 Agent 的冲动。 动物的智能来自进化、身体、动机、好奇心和持续适应,它的行为会被后果重塑。LLM 是由人类文档、统计模式和奖励函数共同塑造的「模拟实体」,给它压力不会让它更努力,给它鼓励也不会让它更可靠。它的能力分布是训练数据和 RL 奖励函数塑造的地形,不是均匀的智能曲线——某些区域高得惊人,某些区域突然塌陷,且边界不稳定。 这个认知直接影响护栏设计的出发点:上下文、权限、工具、验证、审计这些机制不是为了弥补 Agent「不够好」而补的临时补丁,而是因为 Agent 本身就不是一个可以用人类管理直觉去直接套用的对象。控制面是默认配置,不是可选项。]

人的价值上移,但不是消失

「你可以外包思考,但不能外包理解」——这句话在 Agentic Engineering 语境下的具体含义是:API 参数、样板代码、局部重构、测试补全这些细节正在变得便宜,但概念结构、底层机制、业务语义、验收标准、验证体系这些认知层的价值反而在上升。 Karpathy 的例子很具体:他不再记 NumPy 和 PyTorch 之间 API 的细微差异,但必须理解 tensor 是什么、view 和 storage 的关系、什么时候会真的复制数据。细节外包给 Agent 是合理的,但概念结构丢了就失去判断 Agent 输出是否正确的基础。 这条线的延伸是:代码实现能力依然重要,但主要价值在向上迁移——从「能写」变成「能判断」,从「完成功能」变成「设计验收标准」,从「修 bug」变成「建立验证体系」。架构思维在 Agentic Engineering 时代反而变得更核心,而不是更边缘。]

实践启示

对工程团队

  1. 先建验证体系,再扩大 Agent 渗透范围。L1/L2 任务(静态校验、编译测试)可以较大胆地交给 Agent,但 L4 及以上的业务规则和状态变更必须先有可量化的验证机制,没有验证体系托底的 Agentic Engineering 本质上只是高级 Vibe Coding。
  2. 把控制面当成一等公民。Context Control、Tool Control、Permission Control、Runtime Control、Verification Control、Audit Control、Cost Control 这八层不是一个功能清单,而是研发体系设计的一部分,需要和代码审查、CI/CD 一样纳入工程纪律。
  3. 关注过程资产的积累。把稳定的排障路径、发布检查清单、PR review 规范、数据迁移步骤、安全红线写成 Agent 可执行的流程资产——这是让 Agent 沿着团队已验证路径工作而不是靠猜的基础。
  4. 审视现有的基础设施是否 Agent-ready。文档、工具描述、权限模型、执行日志、审计链,今天大部分基础设施默认有人坐在屏幕前操作,Agent 时代的研发链路需要的是另一套能让 Agent 理解、调用、验证、恢复和审计的环境。

对个人开发者

  1. 区分 Vibe Coding 和 Agentic Engineering 的适用场景。原型、个人工具、低风险探索用 Vibe Coding 是合理的;一旦进入影响用户、资金、权限、数据、合规的真实业务系统,需要切换到 Agentic Engineering 思维——先写规格、拆任务、设验证、留审计。
  2. 把精力从「记住 API」迁移到「理解底层机制」。Agent 可以替你查 API 参数,但如果你不理解 tensor、storage、并发模型、业务语义,Agent 输出的代码是否真的高效、是否埋了隐患,你没有办法判断。
  3. 建立自己的 Agent 使用护栏清单。幻觉执行、错误修改代码、误删数据、错误部署、Prompt Injection、成本失控——这些风险是具体且可预防的,每一项都有对应的工程措施。
  4. 用 Agent 辅助实现,但用人守住验收标准。代码能跑不等于代码好,Agent 写的代码常常臃肿、复制粘贴多、抽象别扭。极简和克制是 Agent 目前的弱项,这个口子需要人守。

对组织和技术管理者

  1. 重新评估「会用 AI 编程工具」和「能完成 Agentic Engineering」之间的差异。面试时现场手写算法题测不出在真实工程链路里控制 Agent 的能力——更接近实战的评估方式是:给一个大项目让候选人用 Agent 实现,然后用红队攻击验证安全性。
  2. AI-native 工程师的核心标识是愿意投资工作流优化。就像过去配 Vim、配快捷键一样,现在愿意把 Cursor、Claude Code、Agent 工具链调成真正适合自己工作方式的人,更可能在这个时代建立真正的效率优势。
  3. 关注模型能力边界之外的基础设施收敛信号。Karpathy 在部署、Auth、Payments、DNS、配置等环节遇到的阻力说明 Agent-first 基础设施目前还是缺口——如果这个领域开始出现标准件,Agentic Engineering 的渗透速度会大幅加快。
  4. 盯住三个前瞻信号:①前沿实验室在编程和数学之外往哪些新领域注入 RL 数据——那里会突然出现能力跃升;②Agent-first 部署/权限/验证基础设施是否开始收敛;③下一代模型的 RL 目标是否把代码质量和审美纳入——如果代码不再让人「心脏病发作」,人在抽象简化层守的口子就会变窄。]

相关实体