跳转至

独家对话罗福莉:AI范式已然巨变!

Ch01.475 独家对话罗福莉:AI范式已然巨变!

📊 Level ⭐⭐ | 7.4KB | entities/luo-fuli-ai-paradigm-shift.md

-> 原文存档

核心摘要

  • 范式转移:Chat→Agent时代,Post-train/RL scaling主导,GPU配比从3:5:1变为3:1:1
  • OpenClaw:框架弥补中下层模型短板,激发群体智能,开源社区进步速度决定一切
  • 1T入场券:接近Claude Opus 4.6需1T以上基座参数
  • Skills as 新数据形态:Skills是预训练无法获得的internal信息
  • MiMo-V2:Pro(认知)+ Omni(感知)+ TTS(表达),框架与模型交融才能达到类人智能

关键语录

"上一个时代的成功并不意味着下一个时代的领先,现在基本上大家在同一水平线。" "它先吸收所有人的智能,再靠自己产生更强的智能。这是这一两年会发生的事情。" "Agent范式很吃Post-train。"

相关主题

相关实体

深度分析

1. 范式转移的本质:从"学什么"到"怎么学"

Chat时代以Pre-train为主导——模型通过大规模无监督学习吸收世界知识,RLHF/SFT只是微调对齐。Agent时代的核心逻辑发生了根本性逆转:Post-train/RL scaling成为决定能力上限的关键变量。这一转变的战略含义是:GPU资源配比从3:5:1(Pre-train:SFT:RLHF)重分配为3:1:1,意味着行业重心从"让模型学到更多知识"转向"让模型学会更好地执行任务"。这是一个范式层级的转移,而非技术参数的调整——它要求组织在数据工程、RL基础设施、人才储备上全面重构。

2. "1T入场券"的结构性门槛

罗福莉提出接近Claude Opus 4.6水平需要1T以上基座参数,这一判断背后的逻辑值得拆解。Agent时代的核心竞争力不再只是"知识储备",而是"推理与规划能力"——这需要足够大的基座才能承载RL scaling带来的能力增长空间。更关键的是,这1T参数不是一个平滑递增的曲线,而是存在相变阈值:低于这一阈值的模型,无论RL如何 scaling,其能力上限都会被基座容量锁死。这意味着:①基座能力的军备竞赛远未结束;②中小模型(≤70B)在Agent赛道将面临结构性不利,除非通过框架(如OpenClaw)弥补。

3. OpenClaw揭示的"框架即护城河"

OpenClaw的核心价值不是某个具体技术,而是它作为"框架"激发"群体智能"的机制:好的框架让7B模型做到12B的事。这意味着在Agent时代,框架层的创新比模型层的创新更具杠杆效应。类比软件工程:语言编译器/IDE的进步让低阶程序员也能写出高效代码——OpenClaw正在做同样的事,让weak模型也能完成strong任务。这解释了其开源社区进步速度为何是关键变量:社区贡献者越多,框架弥合模型短板的能力越强,形成网络效应。

4. Skills作为"第三数据形态"的战略意义

罗福莉将Skills描述为"预训练无法获得的internal信息",这是一个极具洞察力的分类。传统数据形态只有两种:预训练数据(互联网公开知识,可爬取) 和 post-train数据(SFT/RLHF标注)。Skills代表第三种:存在于人类专家脑中、从未被成文编码的判断标准、经验、偏好。当前模型的Skills获取只能通过"人类示范+RL"——成本极高、效率极低。这是未来 Agent 系统最难攻克的壁垒,也是个人/组织真正能构建差异化竞争力的地方。

5. MTP vs MLA的技术路线分歧

罗福莉判断MLA(Multi-Head Latent Attention)被"计算bound卡住",不适合Agent时代;MTP(Multi-Token Prediction)可加速推理。这不是简单的技术选择,而是对Agent时代推理特征的判断:Agent需要低成本、快速、多步推理,任何被计算量锁死的方案都会在长context场景中失效。这一判断对小米自身的MiMo-V2架构选择有直接指导意义,也意味着其他选择MLA路线的玩家(主要是Chat时代的主流架构)需要重新评估技术路线。

实践启示

给AI研究者的建议

  1. 重新配置GPU资源:如果仍在按3:5:1配比投入Pre-train,需要重新评估——Agent时代应向Post-train/RL倾斜资源。
  2. 关注框架而非仅关注模型:OpenClaw的案例表明,框架创新可以跨越模型能力差距。在模型能力受限于硬件/预算时,一个好的框架可能是突破口。
  3. Long Context是核心战场:把成本做到足够低、速度做到足够快,才能解锁真正的Agent场景。一兆token context不会是上限。
  4. Skills获取是新研究方向:如何高效、低成本地从专家脑中提取Skills并转化为模型能力,是尚未被充分解决的难题。

给工程师/开发者的建议

  1. 优先学习Agent框架:相比钻研新模型架构,掌握OpenClaw类框架的使用和二次开发,能更快转化为生产力。
  2. 构建个人Skills资产:判断标准、经验、偏好这些"internal信息"是真正难以被复制的能力——在AI时代反而更有价值。
  3. 拥抱平权文化:扁平化的组织文化更有利于创新涌现,层级制度会压制 Agents 时代所需的快速迭代和群体协作。

给组织和战略决策者的建议

  1. 范式转移期是重新洗牌窗口:罗福莉的判断"上一个时代的成功并不意味着下一个时代的领先"是战略警句——在Agent时代,过去的技术积累可能反而成为路径依赖的来源。
  2. 开源社区是核心变量:谁的开源社区进步更快,谁就能在框架层占据优势。投资社区运营可能比单纯投资模型研发更杠杆。
  3. 基座能力仍有规模壁垒:1T参数门槛意味着完全依赖小模型+框架的策略存在上限风险,大规模基座能力建设不可忽视。
  4. 框架与模型需要协同设计:MiMo-V2的Pro+Omni+TTS三层架构表明,单一层面的优化(只有框架或只有模型)无法达到类人智能——需要系统级的协同设计。

相关主题

  • — 开源 Agent 框架,社区进化速度最快
  • — 架构文档
  • — 轻量消息调度
  • — OpenClaw 执行引擎核心
  • — 群体智能进化系统

相关实体