跳转至

开源模型的下一阶段:三类模型分类与生态化路径

Ch01.322 开源模型的下一阶段:三类模型分类与生态化路径

📊 Level ⭐⭐ | 11.5KB | entities/what-comes-next-with-open-models.md

开源模型的下一阶段:三类模型分类与生态化路径

原文存档

摘要

Nathan Lambert 提出开源模型在 2026 年后的三类分化格局:(1) 真正的闭源前沿模型驱动知识工作和编程 Agent;(2) 开源前沿模型在许多场景下表现优异但难以全面追赶;(3) 小而专的开源模型作为"分布式智能",嵌入闭源 Agent 的工具调用链中。文章同时回溯了 Jonathan Rosenberg 2009 年关于 Google 开放战略的内部备忘录、Bill Gurley 关于"防御性开源"的论述,提出开放模型的商业可持续路径在于"多样化、专门化、好奇心",而非对标闭源 frontier。

核心要点

  • 三类模型格局:True closed frontier / Open frontier / Open small as distributed intelligence——第三类是开源的真正未来。
  • 6-18 个月的差距:开源模型历史性地落后闭源 6-18 个月,但这一稳定状态本身令人惊讶(考虑到开源实验室的预算远小于闭源);2026 年起差距可能扩大而非缩小
  • 蒸馏越来越难:以前可以从闭源模型完整 completion 训练学生;现在重要部分是 RL 环境本身和 prompt——这些更容易隐藏。
  • 闭源优势的真正来源 = 垂直整合:芯片、推理软件、权重、工具、UI 全栈闭环——"Claude Code + Opus 4.6"或"Codex + GPT 5.4"的体验根因在此。
  • Google 的开源教训:Android、Chrome 不是"产品",是"护城河"——开源是防御性策略,目标是保护 search 这一利润中心。AI 行业目前没有类似 search 的利润中心来资助开源。
  • 小模型作为分布式智能:前沿 Agent 每项任务反复调用的小模型可外包给 10× 快、100× 便宜的小开源模型;LoRA 适配器使单模型可承载多个内部技能。
  • Qwen 3.5 4B 范例:已有人论证该模型可能超越初代 ChatGPT;前沿模型的"使用场景下沉"会大幅扩大开源生态空间。

深度分析

一、三类模型格局的战略意义

Nathan 提出的分类不是简单的"开源 vs 闭源"二分,而是重新定义了开源模型的真正战场:

类别 定位 代表 商业模式
True closed frontier 知识工作、编程 Agent Claude Opus 4.6、GPT 5.4 API 订阅
Open frontier 部分场景对标闭源 GPT-OSS 120B、Nemotron 3 Super、M2.5 社区 + 商业服务
Open small as distributed intelligence 嵌入闭源 Agent 的工具 Qwen 3.5 4B、Moondream LoRA 微调、按需部署

第三类是被严重低估的开源未来:前沿 Agent 每项任务反复调用的小操作可外包给 10× 快、100× 便宜的小开源模型——这与 Yann 提到的"模型是通才、用户需要专家"互补:小开源模型成为"专家工具",闭源前沿模型成为"协调者"。

二、闭源优势的真正护城河 = 垂直整合

Nathan 的关键洞察:

"Closed models get to vertically integrate everything from the chips they run on, the inference software, the weights, the tools, and the user interface."

闭源模型的优势不在权重(开源也能复现),而在全栈闭环: - 芯片:Anthropic / OpenAI 都和芯片厂商深度合作 - 推理软件:闭源 stack 内部高度优化 - 工具:搜索、代码沙箱、深度研究等深度集成 - UI:Claude Code、Codex 的体验优势来自 UI 而非纯模型

对开源生态的启示:单独发布权重不够——开源实验室需要同时建设"可与之竞争的垂直整合",或找到自己的差异化位置(如 Moonshot、Z.ai 的 coding plans 显示"开源模型 + 便宜 inference 接口"也能吸引用户)。

三、6-18 个月差距不会缩小反而扩大

Nathan 的悲观预测:

  • 闭源在"长 horizon、专门任务"上的优势难以被开源追上
  • 编程任务可通过"小心数据流程 + 抓 GitHub + 巧妙环境"基本解决,但法律、医疗等需要 gate-keeper 介入的领域,闭源训练规模优势是决定性的
  • 前沿模型在"不在公共 web 上的领域"训练——这些无法通过爬取复现

对开源生态的启示:开源模型不应押注"全面追赶闭源"——这是一条注定失败的路径。开源的真正优势在: 1. 可修改性(每个 stack 层都可定制) 2. 本地部署(隐私、低延迟、无网络依赖) 3. 垂直整合的自由度(不受制于闭源 API 的限制)

四、Google 开放战略的历史教训

Nathan 引用了 Jonathan Rosenberg 2009 年内部备忘录:

"Open systems are competitive and far more dynamic. A competitive advantage doesn't derive from locking in customers, but rather from understanding the fast-moving system better than anyone else and using that knowledge to generate better, more innovative products."

以及 Bill Gurley 2011 年的论述:

"Android and Chrome are not 'products' in the classic business sense. They have no plan to become their own 'economic castles.' Rather they are very expensive and very aggressive 'moats,' funded by the height and magnitude of Google's castle."

对 AI 行业的启示:当前没有任何公司有"类似 search 那样的利润中心"来资助大规模开源——这意味着开源 AI 不能复制 Android/Chrome 模式。开源 AI 必须找到自己的可持续路径:可能是 Nvidia(卖 GPU 的护城河驱动)、可能是创业公司(专门做小模型定制)、可能是社区驱动(Meta、Mistral 部分场景)。

五、小模型作为分布式智能的工程路径

Nathan 给出了具体的工程实施路径:

"Picture this, one small model with a series of LoRA adapters that specialize the model to internal skills. This can be deployed very cheaply as tools and a complement to the frontier closed models that are orchestrating agents."

LoRA 适配器 + 小模型的组合是分布式智能的核心基础设施: - 单基座模型 + 多个 LoRA:每个 LoRA 专精一项内部技能(如"提取发票关键字段"、"客服话术分类"、"代码 review") - 成本优势:可在本地或私有云部署,避免闭源 API 按 token 计费 - 延迟优势:本地推理 < 100ms,闭源 API 通常 > 500ms - 隐私优势:敏感数据不出本地

具体范例: - Qwen 3.5 4B 可能超越初代 ChatGPT - Moondream(小型多模态模型)在真实任务上可与 Qwen/Llama 竞争 - 已有 arxiv 论文给出"在特定代码库上微调小模型匹配大模型性能"的配方

六、生态 vs 模型的代际差异

Nathan 的核心战略判断:

"Ecosystems are self-reinforcing, whereas individual models are static artifacts in time... The path forward for open models is to solve different problems than the frontier labs, to find places where open models are effectively free alternatives, to show ways of using specialized models that the closed labs cannot offer."

生态(ecosystem)vs 模型(model)是两个量级的事物: - 模型是时间静态的产品(一旦发布就是固定的) - 生态是自我强化的飞轮(参与者越多 → 价值越大 → 参与者更多)

对开源生态建设的启示:与其追发布新模型,不如建设工具链、评估体系、LoRA 共享平台、部署最佳实践——这些才是生态资产。

实践启示

  1. 企业部署应采用"小开源 + 大闭源"混合架构:闭源前沿模型作为协调者,开源小模型作为高频任务的工具(如分类、提取、简单生成),实现 10× 快、100× 便宜的优化。
  2. 建立 LoRA 适配器库:每个垂直技能一个 LoRA,共享单基座模型,部署成本极低且可独立迭代。
  3. 不要押注"开源全面追赶闭源":这是注定失败的路径,应转向"专门化、本地化、可修改性"差异化。
  4. 本地部署用于隐私敏感场景:医疗、法律、金融数据通过本地小模型处理,只有需要前沿能力时才调用闭源 API。
  5. 开源项目应建立"垂直整合"而不仅是发布权重:提供 inference stack、tooling、UI 模板,让用户能真正运行起来。
  6. 关注推理效率而非仅 benchmark 分数:在边缘设备、低成本部署场景下,token/秒、token/美元才是关键指标。
  7. 为不同任务构建专门的评估集:Moondream、Qwen 3.5 4B 在"特定代码库"或"特定文档"任务上可超越大模型,关键是建立垂直评估。

相关实体