foundation capital agent era six insights¶
Ch04.173 foundation capital agent era six insights¶
📊 Level ⭐⭐ | 12.0KB |
entities/foundation-capital-agent-era-six-insights.md-> 原文存档
核心定位¶
Foundation Capital 合伙人 Ashu Garg(2026-05-07)基于 Turing CEO Jonathan Siddharth + Arize CPO Aparna Dhinakaran 对谈的投资 thesis。核心命题:Agent 才是软件的主用户;上下文图谱是真正护城河;反馈闭环本身是产品。
三大拐点框架¶
| 拐点 | 时间 | 核心 |
|---|---|---|
| ChatGPT 时刻 | 2022年底 | 预训练+RLHF 证明语言模型可做通用界面 |
| o1 时刻 | 2024年 | 推理时算力作为第二套独立扩展定律 |
| 长程 Agent 时刻 | 现在 | 自主计划+行动+从失败中恢复+持续执行,无需人类每步介入 |
六条洞察¶
洞察一:Agent 是主用户¶
核心原则:Agent 优先,人类其次——不是愿景宣言,是 Turing 的日常运营原则。 根本转变:主要操作者从人到 Agent → 设计要求根本改变:
- 编程接口优先于可视化界面
- 可预测系统状态优先于丰富交互体验 推论:没有清晰编程接口、不能被 Agent 调用的产品 → 为旧世界构建。Agent 将成为杠杆率最高的用户。
洞察二:可插拔 > 微调¶
Aparna 经验:维护微调模型的成本通常超过节省;每次基础模型重大更新都需重做。 原则:工程体系允许一天内切换底层模型,外层 Harness 对底层权重不可知。 Harness 本质:用户和模型之间的工程层(路由/记忆/验证/多步编排)。大部分是常规软件工程,不依赖特定模型。 重要推论:框架层面的积累比押注特定模型或微调配方更持久。
洞察三:上下文图谱 = 真正护城河¶
定义:数据在各系统间被导航和协调以支撑决策的方式——包括隐性判断调用、跨系统隐性规则、员工头脑中的隐性知识。 捕获内容:发生了什么、为什么这么决定、结果如何。随每次决策积累,越来越难复制。 现状问题:数据和流程存在于互相隔离的工具孤岛里,只有懂业务的人知道怎么整合。让决策底座对 Agent 可寻址,是"无聊但关键"的组织性基础工作。
洞察四:反馈循环 = 产品¶
诊断:AI 对财富500强实际运营的影响几乎为零——不是因为模型能力不够,而是部署质量太差。 解法:把 Agent 当新员工来管理——入职流程(告知边界+升级路径)+ 持续反馈机制(每次失败记录分析)+ 投入负责人。 Aparna 愿景:Agent 消费自己的可观测性数据,识别失败点,自动生成评估用例,自主发布下次迭代。自我改进闭环本身就是产品。 开放问题:Agent 身份与权限体系(用什么身份认证?能访问/执行什么?谁负责?)
洞察五:知识工作 = 与 Agent 的持续关系¶
基本单位转变:孤立一次性对话 → 人类与 Agent 的持续关系。 Agent 形态:持续运行数月甚至更长,拥有持续身份,积累工作上下文,协调其他 Agent,在需要判断时主动纳入人类。 人类角色:从"执行工作" → "设定方向、提供判断、验证结果"——"处于循环中的人类"。 新设计问题:Agent 持续运行数月后的"签到"模式 / 数百 Agent 同时运行的"收件箱" / Agent 完成大部分工作的问责机制。
洞察六:AI 不变的领域¶
Aparna:招聘、维护公司文化、企业销售(两人在同一房间才能建立的信任)。 Jonathan:销售、招聘、以建立人际关系本身为核心产品的角色。 真正留给人类的:构建什么、与谁一起构建、公司代表什么——需要价值观和志向,不是任务执行能力。
核心量化数据¶
| 指标 | 数据 |
|---|---|
| METR 50%成功率任务时长(过去一年) | 2小时 → 12小时以上 |
| Claude Code GitHub 提交占比 | 4%(发布仅一年多) |
| OpenClaw 超过 Linux 星标里程碑 | 3个月(Linux 15年) |
深度分析¶
从"工具"到"用户"的范式转移¶
Foundation Capital 洞察中最具颠覆性的命题不是某个具体技术判断,而是谁才是软件的主用户这一根本问题的重新定性。当 Turing 将"Agent 优先"从口号落地为日常运营原则,它意味着: 1. API First 设计取代 UI First:产品的可编程性成为核心竞争力,交互丰富度退居次席 2. 系统可观测性成为基础设施:Agent 需要读取状态、写入动作、理解上下文——这对人类用户"不言自明"的状态,对 Agent 必须显式建模 3. 容错设计从"优雅降级"转向"可恢复":Agent 失败后能自主恢复比单次请求成功更重要 这一转移的深远影响:未来衡量产品力的指标不再是日活用户数,而是 API 调用频次、Agent 任务完成率、系统可寻址面积。
Harness 范式的持久性论证¶
"可插拔 > 微调"这条洞察的政策含义远大于技术含义。它实质上是在说:
模型是流水的,框架是铁打的。 每一次 GPT-4 到 GPT-4.5、Claude 3 到 Claude 4 的迭代,押注微调的团队都在重构。但构建了 Harness 的团队——那些把路由逻辑、业务规则、评估框架、记忆管理封装成可迁移资产的组织——每一次模型迭代都在积累而非损耗。 这解释了一个现象:为什么 OpenAI 的模型能力在快速商品化,但 few-shot learning 和 prompt engineering 的工程实践却越来越值钱。不是因为模型不够好,而是因为框架层沉淀的是关于业务的判断力,而这与模型无关。
上下文图谱的结构性含义¶
上下文图谱(Context Graph)的本质是对隐性知识显性化、个体知识系统化的长期投资。它不是另一个数据仓库概念,而是:
- 决策的 provenance:每一次判断都有记录、可追溯、能复现
- 跨系统协调的协议:不同工具之间的数据流转规则显式化
- 组织记忆的载体:员工头脑中的经验转化为系统可执行的规则 这对护城河的意义在于:它具有网络效应和时间壁垒。每一个新决策都在丰富图谱,使后来者复制难度非线性增长。
Agent 部署质量危机的深层原因¶
Jonathan 的判断——AI 对财富500强实际影响"几乎为零"——指向的不是技术失败,而是部署方法论的根本缺位。 传统软件部署有成熟的 CI/CD、监控、 incident response 体系。但 Agent 系统的输出是非确定性的、跨系统的、上下文敏感的——这些特性使得传统的监控和响应范式直接失效。 Aparna 提出的"Agent as new hire"管理框架的真正价值在于:它把一套成熟的人类员工管理经验(入职/onboarding、反馈、绩效管理)系统性地迁移到 Agent 运营领域。这是目前最可操作的 Agent 质量管理方法论。
实践启示¶
对 AI 产品创始人的行动清单¶
- 重新定义 MVP:最小可行产品不再是"有 UI 能跑通流程",而是"有 API 能被 Agent 调用且能返回结构化结果"
- 投资 Harness 层:即使第一版产品用单一模型,也要用可插拔架构——今天省的这个设计会在模型迭代时10倍偿还
- 从第0天开始构建可观测性:Agent 行为日志、决策路径、失败模式——这些数据不只是运维需求,是产品迭代的核心资产
- 设计人机协作界面而非纯 UI:产品需要同时服务人类和 Agent——考虑"签到模式"、"委托确认"、"升级路径"这些新交互范式
对企业 Agent 落地的建议¶
- 从单点场景切入而非全流程覆盖:选择一个高频、低风险、输出可验证的场景(如代码审查、数据提取、报告生成),跑通反馈闭环后再扩展
- 建立 Agent 的"入职"和"绩效评估"流程:明确 Agent 的职责边界、成功率 SLO、失败升级路径,以及负责人
- 投资上下文图谱建设:主动梳理跨系统的数据流和决策规则——这是苦活,但每一分投入都在构建无法被复制的护城河
- 关注 Agent 身份与权限体系的成熟:这是目前企业 Agent 落地的最大监管和合规风险点,提前布局审计日志和权限隔离
对投资人的分析框架¶
- Agent-nativity 作为评估维度:创始团队是否真正理解 Agent 优先设计,还是只是在现有产品上加个 AI 按钮
- Harness 积累作为护城河指标:看团队是否有框架层的持久积累,而非单纯依赖模型能力
- 反馈闭环密度作为运营健康度:Agent 系统是否建立了快速的失败→归因→改进循环,这比单纯的模型准确率更能预测长期价值
- 上下文图谱的可迁移性:目标公司的数据资产是锁在孤岛里,还是已经对 Agent 可寻址
个人工作者应对策略¶
- 成为"设定方向、提供判断、验证结果"的人:从任务执行者转型为 Agent 的管理者和仲裁者
- 建立个人工作流的 Agent 化:识别自己工作中可委托给 Agent 的高频任务,建立清晰的上下文提供和结果验证机制
- 投资跨领域判断力:当执行工作被 Agent 接管,人类独有的价值在于跨领域整合判断——这是纯任务执行型 Agent 目前最弱的能力
相关概念¶
- Harness Engineering — "可插拔>微调"洞察与 Harness Engineering 的核心命题完全一致:框架比模型更持久
- Factory Mission — 多 Agent 协作框架 vs. Foundation Capital 的 Agent 主用户原则相互印证
- Autobrowse — 同样的"反馈循环=产品"洞察,Autobrowse 通过技能文件实现自我改进闭环
- Anthropic Claude Managed Agents — Claude Managed Agents 的 Outcomes Loop 自我评估是"反馈闭环=产品"的具体工程实现
- — Jonathan Siddharth 是 Turing CEO,其 Agent 优先实践是本篇发言的背景注脚;三角 Orchestrator+Worker+Validator 架构与本文洞察相互印证
Last updated: 2026-05-08 评审:Value 8 × Confidence 8 = 64 ✅ PASS | ★★★★