Decisions and Dollars¶

Ch01.648 Decisions and Dollars¶

📊 Level ⭐⭐ | 5.0KB | entities/decisions-and-dollars-agent-economics-data-fintech.md

Decisions and Dollars¶

Background：Nikunj Kothari 基于 Cloudflare agent traffic 超越 human traffic 的事实、Cursor $60B 收购案、以及 Harvey/Legora/Rogo 等垂直 AI 公司的实践，系统分析了 AI 应用公司在 agent 经济时代的商业模式转型逻辑。

核心论点¶

Agent 正在成为软件的主要用户。Cloudflare 数据显示 agent traffic 已超过 human traffic。当一千名员工运行十万 agent 时，per-seat 定价彻底失效。Agent 留下两样值得计量的东西：决策（数据）和资金流动（金融科技）。

Context -> Harness -> Judgment 三层演化¶

知识从人转移到模型经历了三个阶段：

Context（上下文）：检索增强，将正确信息放在模型面前 — 已成 table stakes
Harness（工程框架）：模型运行的脚手架和循环结构
Judgment（判断力）：每次调用和纠正留下的决策记录 — 唯一能持续累积价值的层

Context 已被所有竞争对手以相同方式组装。Judgment 才是真正的护城河。

Cursor $60B 收购案的数据护城河逻辑¶

xAI 以 $60B 收购 Cursor 的核心原因不是软件本身，而是百万开发者使用模型的决策记录（accept/reject/rewrite 的 diff 数据）。Cursor 的产品赢在品味（taste），但数据成为其主要护城河。Cursor 现在基于这些 diff 训练自己的模型。

纠正即数据（Corrections as Scorecard）¶

用户对模型输出的每次修正都记录了"在你的业务中什么是对的"。这个记分卡做两件事： - 训练信号：将租用的模型调优到你的业务 - 测试集：衡量 agent 是否真正进步的唯一方式（没有公开 benchmark 衡量你的工作流）

Fine-tuning 和 RL 成本已低到 B 轮公司就能运行这个循环。

垂直 AI 公司的实践¶

Harvey（$11B）和 Legora（>$5B）：法律领域，律师对草稿的编辑是独有的 judgment 数据
Rogo：金融领域，捕获分析师构建模型和修改备忘录的过程
Toast：餐厅本质是带厨房的支付处理器，payments 收入远超软件
Ramp：免费企业卡 + 每美元抽成一两美分 -> $32B 公司

这些公司都没训练 foundation model，而是围绕租用的模型构建 harness，保留了流经其中的 judgment。

实验室购买 Judgment 的趋势¶

Mercor（$10B）：付专家 $85/hr 做 human-labeled data
Meta（$14B for Scale）：拥有标注流水线
多家 RL 环境公司已达到数亿 ARR，出售长时间跨度任务的 judgment

实验室在全互联网训练数据耗尽后，开始直接购买决策数据。

与现有实体的差异化¶

维度	本文（Nikunj Kothari）	Stripe Agent 经济基础设施	Token 经济学与 AI 效率
主轴	应用公司必须成为数据+金融科技公司	Stripe 5 套支付产品图谱	Token 效率和推理优化
核心框架	Context->Harness->Judgment 三层演化	MPP + Link + Projects + Metronome + Radar	模型路由和成本优化
案例	Cursor $60B, Harvey, Ramp, Toast	Stripe 内部产品线	推理效率比
独特洞察	纠正即数据、数据护城河 vs token markup 无护城河	机器支付协议细节	Token 计量经济学

三个独有贡献（不应合并到现有 entity）¶

Context -> Harness -> Judgment 三层演化框架 — 描述了知识从人转移到模型的三个阶段，Judgment 是唯一累积层
Cursor $60B 收购的数据护城河分析 — 不是为软件付费，是为百万开发者的决策 diff 数据付费
纠正即数据（Corrections as Scorecard） — 用户修正既是训练信号也是测试集，这个双功能洞察在现有实体中未出现