foundation capital agent era six insights¶

Ch04.173 foundation capital agent era six insights¶

📊 Level ⭐⭐ | 12.0KB | entities/foundation-capital-agent-era-six-insights.md

-> 原文存档

核心定位¶

Foundation Capital 合伙人 Ashu Garg（2026-05-07）基于 Turing CEO Jonathan Siddharth + Arize CPO Aparna Dhinakaran 对谈的投资 thesis。核心命题：Agent 才是软件的主用户；上下文图谱是真正护城河；反馈闭环本身是产品。

三大拐点框架¶

拐点	时间	核心
ChatGPT 时刻	2022年底	预训练+RLHF 证明语言模型可做通用界面
o1 时刻	2024年	推理时算力作为第二套独立扩展定律
长程 Agent 时刻	现在	自主计划+行动+从失败中恢复+持续执行，无需人类每步介入

六条洞察¶

洞察一：Agent 是主用户¶

核心原则：Agent 优先，人类其次——不是愿景宣言，是 Turing 的日常运营原则。 根本转变：主要操作者从人到 Agent → 设计要求根本改变：

编程接口优先于可视化界面
可预测系统状态优先于丰富交互体验推论：没有清晰编程接口、不能被 Agent 调用的产品 → 为旧世界构建。Agent 将成为杠杆率最高的用户。

洞察二：可插拔 > 微调¶

Aparna 经验：维护微调模型的成本通常超过节省；每次基础模型重大更新都需重做。原则：工程体系允许一天内切换底层模型，外层 Harness 对底层权重不可知。 Harness 本质：用户和模型之间的工程层（路由/记忆/验证/多步编排）。大部分是常规软件工程，不依赖特定模型。 重要推论：框架层面的积累比押注特定模型或微调配方更持久。

洞察三：上下文图谱 = 真正护城河¶

定义：数据在各系统间被导航和协调以支撑决策的方式——包括隐性判断调用、跨系统隐性规则、员工头脑中的隐性知识。 捕获内容：发生了什么、为什么这么决定、结果如何。随每次决策积累，越来越难复制。 现状问题：数据和流程存在于互相隔离的工具孤岛里，只有懂业务的人知道怎么整合。让决策底座对 Agent 可寻址，是"无聊但关键"的组织性基础工作。

洞察四：反馈循环 = 产品¶

诊断：AI 对财富500强实际运营的影响几乎为零——不是因为模型能力不够，而是部署质量太差。解法：把 Agent 当新员工来管理——入职流程（告知边界+升级路径）+ 持续反馈机制（每次失败记录分析）+ 投入负责人。 Aparna 愿景：Agent 消费自己的可观测性数据，识别失败点，自动生成评估用例，自主发布下次迭代。自我改进闭环本身就是产品。 开放问题：Agent 身份与权限体系（用什么身份认证？能访问/执行什么？谁负责？）

洞察五：知识工作 = 与 Agent 的持续关系¶

基本单位转变：孤立一次性对话 → 人类与 Agent 的持续关系。 Agent 形态：持续运行数月甚至更长，拥有持续身份，积累工作上下文，协调其他 Agent，在需要判断时主动纳入人类。 人类角色：从"执行工作" → "设定方向、提供判断、验证结果"——"处于循环中的人类"。 新设计问题：Agent 持续运行数月后的"签到"模式 / 数百 Agent 同时运行的"收件箱" / Agent 完成大部分工作的问责机制。

洞察六：AI 不变的领域¶

Aparna：招聘、维护公司文化、企业销售（两人在同一房间才能建立的信任）。 Jonathan：销售、招聘、以建立人际关系本身为核心产品的角色。 真正留给人类的：构建什么、与谁一起构建、公司代表什么——需要价值观和志向，不是任务执行能力。

核心量化数据¶

指标	数据
METR 50%成功率任务时长（过去一年）	2小时 → 12小时以上
Claude Code GitHub 提交占比	4%（发布仅一年多）
OpenClaw 超过 Linux 星标里程碑	3个月（Linux 15年）

深度分析¶

从"工具"到"用户"的范式转移¶

Foundation Capital 洞察中最具颠覆性的命题不是某个具体技术判断，而是谁才是软件的主用户这一根本问题的重新定性。当 Turing 将"Agent 优先"从口号落地为日常运营原则，它意味着： 1. API First 设计取代 UI First：产品的可编程性成为核心竞争力，交互丰富度退居次席 2. 系统可观测性成为基础设施：Agent 需要读取状态、写入动作、理解上下文——这对人类用户"不言自明"的状态，对 Agent 必须显式建模 3. 容错设计从"优雅降级"转向"可恢复"：Agent 失败后能自主恢复比单次请求成功更重要这一转移的深远影响：未来衡量产品力的指标不再是日活用户数，而是 API 调用频次、Agent 任务完成率、系统可寻址面积。

Harness 范式的持久性论证¶

"可插拔 > 微调"这条洞察的政策含义远大于技术含义。它实质上是在说：

模型是流水的，框架是铁打的。 每一次 GPT-4 到 GPT-4.5、Claude 3 到 Claude 4 的迭代，押注微调的团队都在重构。但构建了 Harness 的团队——那些把路由逻辑、业务规则、评估框架、记忆管理封装成可迁移资产的组织——每一次模型迭代都在积累而非损耗。这解释了一个现象：为什么 OpenAI 的模型能力在快速商品化，但 few-shot learning 和 prompt engineering 的工程实践却越来越值钱。不是因为模型不够好，而是因为框架层沉淀的是关于业务的判断力，而这与模型无关。

上下文图谱的结构性含义¶

上下文图谱（Context Graph）的本质是对隐性知识显性化、个体知识系统化的长期投资。它不是另一个数据仓库概念，而是：

决策的 provenance：每一次判断都有记录、可追溯、能复现
跨系统协调的协议：不同工具之间的数据流转规则显式化
组织记忆的载体：员工头脑中的经验转化为系统可执行的规则这对护城河的意义在于：它具有网络效应和时间壁垒。每一个新决策都在丰富图谱，使后来者复制难度非线性增长。

Agent 部署质量危机的深层原因¶

Jonathan 的判断——AI 对财富500强实际影响"几乎为零"——指向的不是技术失败，而是部署方法论的根本缺位。传统软件部署有成熟的 CI/CD、监控、 incident response 体系。但 Agent 系统的输出是非确定性的、跨系统的、上下文敏感的——这些特性使得传统的监控和响应范式直接失效。 Aparna 提出的"Agent as new hire"管理框架的真正价值在于：它把一套成熟的人类员工管理经验（入职/onboarding、反馈、绩效管理）系统性地迁移到 Agent 运营领域。这是目前最可操作的 Agent 质量管理方法论。

实践启示¶

对 AI 产品创始人的行动清单¶

重新定义 MVP：最小可行产品不再是"有 UI 能跑通流程"，而是"有 API 能被 Agent 调用且能返回结构化结果"
投资 Harness 层：即使第一版产品用单一模型，也要用可插拔架构——今天省的这个设计会在模型迭代时10倍偿还
从第0天开始构建可观测性：Agent 行为日志、决策路径、失败模式——这些数据不只是运维需求，是产品迭代的核心资产
设计人机协作界面而非纯 UI：产品需要同时服务人类和 Agent——考虑"签到模式"、"委托确认"、"升级路径"这些新交互范式

对企业 Agent 落地的建议¶

从单点场景切入而非全流程覆盖：选择一个高频、低风险、输出可验证的场景（如代码审查、数据提取、报告生成），跑通反馈闭环后再扩展
建立 Agent 的"入职"和"绩效评估"流程：明确 Agent 的职责边界、成功率 SLO、失败升级路径，以及负责人
投资上下文图谱建设：主动梳理跨系统的数据流和决策规则——这是苦活，但每一分投入都在构建无法被复制的护城河
关注 Agent 身份与权限体系的成熟：这是目前企业 Agent 落地的最大监管和合规风险点，提前布局审计日志和权限隔离

对投资人的分析框架¶

Agent-nativity 作为评估维度：创始团队是否真正理解 Agent 优先设计，还是只是在现有产品上加个 AI 按钮
Harness 积累作为护城河指标：看团队是否有框架层的持久积累，而非单纯依赖模型能力
反馈闭环密度作为运营健康度：Agent 系统是否建立了快速的失败→归因→改进循环，这比单纯的模型准确率更能预测长期价值
上下文图谱的可迁移性：目标公司的数据资产是锁在孤岛里，还是已经对 Agent 可寻址

个人工作者应对策略¶

成为"设定方向、提供判断、验证结果"的人：从任务执行者转型为 Agent 的管理者和仲裁者
建立个人工作流的 Agent 化：识别自己工作中可委托给 Agent 的高频任务，建立清晰的上下文提供和结果验证机制
投资跨领域判断力：当执行工作被 Agent 接管，人类独有的价值在于跨领域整合判断——这是纯任务执行型 Agent 目前最弱的能力