跳转至

foundation capital agent era six insights

Ch04.173 foundation capital agent era six insights

📊 Level ⭐⭐ | 12.0KB | entities/foundation-capital-agent-era-six-insights.md

-> 原文存档

核心定位

Foundation Capital 合伙人 Ashu Garg(2026-05-07)基于 Turing CEO Jonathan Siddharth + Arize CPO Aparna Dhinakaran 对谈的投资 thesis。核心命题:Agent 才是软件的主用户;上下文图谱是真正护城河;反馈闭环本身是产品。

三大拐点框架

拐点 时间 核心
ChatGPT 时刻 2022年底 预训练+RLHF 证明语言模型可做通用界面
o1 时刻 2024年 推理时算力作为第二套独立扩展定律
长程 Agent 时刻 现在 自主计划+行动+从失败中恢复+持续执行,无需人类每步介入

六条洞察

洞察一:Agent 是主用户

核心原则:Agent 优先,人类其次——不是愿景宣言,是 Turing 的日常运营原则。 根本转变:主要操作者从人到 Agent → 设计要求根本改变:

  • 编程接口优先于可视化界面
  • 可预测系统状态优先于丰富交互体验 推论:没有清晰编程接口、不能被 Agent 调用的产品 → 为旧世界构建。Agent 将成为杠杆率最高的用户。

洞察二:可插拔 > 微调

Aparna 经验:维护微调模型的成本通常超过节省;每次基础模型重大更新都需重做。 原则:工程体系允许一天内切换底层模型,外层 Harness 对底层权重不可知。 Harness 本质:用户和模型之间的工程层(路由/记忆/验证/多步编排)。大部分是常规软件工程,不依赖特定模型。 重要推论:框架层面的积累比押注特定模型或微调配方更持久。

洞察三:上下文图谱 = 真正护城河

定义:数据在各系统间被导航和协调以支撑决策的方式——包括隐性判断调用、跨系统隐性规则、员工头脑中的隐性知识。 捕获内容:发生了什么、为什么这么决定、结果如何。随每次决策积累,越来越难复制。 现状问题:数据和流程存在于互相隔离的工具孤岛里,只有懂业务的人知道怎么整合。让决策底座对 Agent 可寻址,是"无聊但关键"的组织性基础工作。

洞察四:反馈循环 = 产品

诊断:AI 对财富500强实际运营的影响几乎为零——不是因为模型能力不够,而是部署质量太差。 解法:把 Agent 当新员工来管理——入职流程(告知边界+升级路径)+ 持续反馈机制(每次失败记录分析)+ 投入负责人。 Aparna 愿景:Agent 消费自己的可观测性数据,识别失败点,自动生成评估用例,自主发布下次迭代。自我改进闭环本身就是产品。 开放问题:Agent 身份与权限体系(用什么身份认证?能访问/执行什么?谁负责?)

洞察五:知识工作 = 与 Agent 的持续关系

基本单位转变:孤立一次性对话 → 人类与 Agent 的持续关系。 Agent 形态:持续运行数月甚至更长,拥有持续身份,积累工作上下文,协调其他 Agent,在需要判断时主动纳入人类。 人类角色:从"执行工作" → "设定方向、提供判断、验证结果"——"处于循环中的人类"。 新设计问题:Agent 持续运行数月后的"签到"模式 / 数百 Agent 同时运行的"收件箱" / Agent 完成大部分工作的问责机制。

洞察六:AI 不变的领域

Aparna:招聘、维护公司文化、企业销售(两人在同一房间才能建立的信任)。 Jonathan:销售、招聘、以建立人际关系本身为核心产品的角色。 真正留给人类的:构建什么、与谁一起构建、公司代表什么——需要价值观和志向,不是任务执行能力。

核心量化数据

指标 数据
METR 50%成功率任务时长(过去一年) 2小时 → 12小时以上
Claude Code GitHub 提交占比 4%(发布仅一年多)
OpenClaw 超过 Linux 星标里程碑 3个月(Linux 15年)

深度分析

从"工具"到"用户"的范式转移

Foundation Capital 洞察中最具颠覆性的命题不是某个具体技术判断,而是谁才是软件的主用户这一根本问题的重新定性。当 Turing 将"Agent 优先"从口号落地为日常运营原则,它意味着: 1. API First 设计取代 UI First:产品的可编程性成为核心竞争力,交互丰富度退居次席 2. 系统可观测性成为基础设施:Agent 需要读取状态、写入动作、理解上下文——这对人类用户"不言自明"的状态,对 Agent 必须显式建模 3. 容错设计从"优雅降级"转向"可恢复":Agent 失败后能自主恢复比单次请求成功更重要 这一转移的深远影响:未来衡量产品力的指标不再是日活用户数,而是 API 调用频次、Agent 任务完成率、系统可寻址面积。

Harness 范式的持久性论证

"可插拔 > 微调"这条洞察的政策含义远大于技术含义。它实质上是在说:

模型是流水的,框架是铁打的。 每一次 GPT-4 到 GPT-4.5、Claude 3 到 Claude 4 的迭代,押注微调的团队都在重构。但构建了 Harness 的团队——那些把路由逻辑、业务规则、评估框架、记忆管理封装成可迁移资产的组织——每一次模型迭代都在积累而非损耗。 这解释了一个现象:为什么 OpenAI 的模型能力在快速商品化,但 few-shot learning 和 prompt engineering 的工程实践却越来越值钱。不是因为模型不够好,而是因为框架层沉淀的是关于业务的判断力,而这与模型无关。

上下文图谱的结构性含义

上下文图谱(Context Graph)的本质是对隐性知识显性化、个体知识系统化的长期投资。它不是另一个数据仓库概念,而是:

  • 决策的 provenance:每一次判断都有记录、可追溯、能复现
  • 跨系统协调的协议:不同工具之间的数据流转规则显式化
  • 组织记忆的载体:员工头脑中的经验转化为系统可执行的规则 这对护城河的意义在于:它具有网络效应和时间壁垒。每一个新决策都在丰富图谱,使后来者复制难度非线性增长。

Agent 部署质量危机的深层原因

Jonathan 的判断——AI 对财富500强实际影响"几乎为零"——指向的不是技术失败,而是部署方法论的根本缺位。 传统软件部署有成熟的 CI/CD、监控、 incident response 体系。但 Agent 系统的输出是非确定性的、跨系统的、上下文敏感的——这些特性使得传统的监控和响应范式直接失效。 Aparna 提出的"Agent as new hire"管理框架的真正价值在于:它把一套成熟的人类员工管理经验(入职/onboarding、反馈、绩效管理)系统性地迁移到 Agent 运营领域。这是目前最可操作的 Agent 质量管理方法论。

实践启示

对 AI 产品创始人的行动清单

  1. 重新定义 MVP:最小可行产品不再是"有 UI 能跑通流程",而是"有 API 能被 Agent 调用且能返回结构化结果"
  2. 投资 Harness 层:即使第一版产品用单一模型,也要用可插拔架构——今天省的这个设计会在模型迭代时10倍偿还
  3. 从第0天开始构建可观测性:Agent 行为日志、决策路径、失败模式——这些数据不只是运维需求,是产品迭代的核心资产
  4. 设计人机协作界面而非纯 UI:产品需要同时服务人类和 Agent——考虑"签到模式"、"委托确认"、"升级路径"这些新交互范式

对企业 Agent 落地的建议

  1. 从单点场景切入而非全流程覆盖:选择一个高频、低风险、输出可验证的场景(如代码审查、数据提取、报告生成),跑通反馈闭环后再扩展
  2. 建立 Agent 的"入职"和"绩效评估"流程:明确 Agent 的职责边界、成功率 SLO、失败升级路径,以及负责人
  3. 投资上下文图谱建设:主动梳理跨系统的数据流和决策规则——这是苦活,但每一分投入都在构建无法被复制的护城河
  4. 关注 Agent 身份与权限体系的成熟:这是目前企业 Agent 落地的最大监管和合规风险点,提前布局审计日志和权限隔离

对投资人的分析框架

  1. Agent-nativity 作为评估维度:创始团队是否真正理解 Agent 优先设计,还是只是在现有产品上加个 AI 按钮
  2. Harness 积累作为护城河指标:看团队是否有框架层的持久积累,而非单纯依赖模型能力
  3. 反馈闭环密度作为运营健康度:Agent 系统是否建立了快速的失败→归因→改进循环,这比单纯的模型准确率更能预测长期价值
  4. 上下文图谱的可迁移性:目标公司的数据资产是锁在孤岛里,还是已经对 Agent 可寻址

个人工作者应对策略

  1. 成为"设定方向、提供判断、验证结果"的人:从任务执行者转型为 Agent 的管理者和仲裁者
  2. 建立个人工作流的 Agent 化:识别自己工作中可委托给 Agent 的高频任务,建立清晰的上下文提供和结果验证机制
  3. 投资跨领域判断力:当执行工作被 Agent 接管,人类独有的价值在于跨领域整合判断——这是纯任务执行型 Agent 目前最弱的能力

相关概念

  • Harness Engineering — "可插拔>微调"洞察与 Harness Engineering 的核心命题完全一致:框架比模型更持久
  • Factory Mission — 多 Agent 协作框架 vs. Foundation Capital 的 Agent 主用户原则相互印证
  • Autobrowse — 同样的"反馈循环=产品"洞察,Autobrowse 通过技能文件实现自我改进闭环
  • Anthropic Claude Managed Agents — Claude Managed Agents 的 Outcomes Loop 自我评估是"反馈闭环=产品"的具体工程实现
  • — Jonathan Siddharth 是 Turing CEO,其 Agent 优先实践是本篇发言的背景注脚;三角 Orchestrator+Worker+Validator 架构与本文洞察相互印证

Last updated: 2026-05-08 评审:Value 8 × Confidence 8 = 64 ✅ PASS | ★★★★

相关实体