独家对话罗福莉：AI范式已然巨变！¶

Ch01.475 独家对话罗福莉：AI范式已然巨变！¶

📊 Level ⭐⭐ | 7.4KB | entities/luo-fuli-ai-paradigm-shift.md

-> 原文存档

核心摘要¶

范式转移：Chat→Agent时代，Post-train/RL scaling主导，GPU配比从3:5:1变为3:1:1
OpenClaw：框架弥补中下层模型短板，激发群体智能，开源社区进步速度决定一切
1T入场券：接近Claude Opus 4.6需1T以上基座参数
Skills as 新数据形态：Skills是预训练无法获得的internal信息
MiMo-V2：Pro（认知）+ Omni（感知）+ TTS（表达），框架与模型交融才能达到类人智能

关键语录¶

"上一个时代的成功并不意味着下一个时代的领先，现在基本上大家在同一水平线。" "它先吸收所有人的智能，再靠自己产生更强的智能。这是这一两年会发生的事情。" "Agent范式很吃Post-train。"

深度分析¶

1. 范式转移的本质：从"学什么"到"怎么学"¶

Chat时代以Pre-train为主导——模型通过大规模无监督学习吸收世界知识，RLHF/SFT只是微调对齐。Agent时代的核心逻辑发生了根本性逆转：Post-train/RL scaling成为决定能力上限的关键变量。这一转变的战略含义是：GPU资源配比从3:5:1（Pre-train:SFT:RLHF）重分配为3:1:1，意味着行业重心从"让模型学到更多知识"转向"让模型学会更好地执行任务"。这是一个范式层级的转移，而非技术参数的调整——它要求组织在数据工程、RL基础设施、人才储备上全面重构。

2. "1T入场券"的结构性门槛¶

罗福莉提出接近Claude Opus 4.6水平需要1T以上基座参数，这一判断背后的逻辑值得拆解。Agent时代的核心竞争力不再只是"知识储备"，而是"推理与规划能力"——这需要足够大的基座才能承载RL scaling带来的能力增长空间。更关键的是，这1T参数不是一个平滑递增的曲线，而是存在相变阈值：低于这一阈值的模型，无论RL如何 scaling，其能力上限都会被基座容量锁死。这意味着：①基座能力的军备竞赛远未结束；②中小模型（≤70B）在Agent赛道将面临结构性不利，除非通过框架（如OpenClaw）弥补。

3. OpenClaw揭示的"框架即护城河"¶

OpenClaw的核心价值不是某个具体技术，而是它作为"框架"激发"群体智能"的机制：好的框架让7B模型做到12B的事。这意味着在Agent时代，框架层的创新比模型层的创新更具杠杆效应。类比软件工程：语言编译器/IDE的进步让低阶程序员也能写出高效代码——OpenClaw正在做同样的事，让weak模型也能完成strong任务。这解释了其开源社区进步速度为何是关键变量：社区贡献者越多，框架弥合模型短板的能力越强，形成网络效应。

4. Skills作为"第三数据形态"的战略意义¶

罗福莉将Skills描述为"预训练无法获得的internal信息"，这是一个极具洞察力的分类。传统数据形态只有两种：预训练数据（互联网公开知识，可爬取）和 post-train数据（SFT/RLHF标注）。Skills代表第三种：存在于人类专家脑中、从未被成文编码的判断标准、经验、偏好。当前模型的Skills获取只能通过"人类示范+RL"——成本极高、效率极低。这是未来 Agent 系统最难攻克的壁垒，也是个人/组织真正能构建差异化竞争力的地方。

5. MTP vs MLA的技术路线分歧¶

罗福莉判断MLA（Multi-Head Latent Attention）被"计算bound卡住"，不适合Agent时代；MTP（Multi-Token Prediction）可加速推理。这不是简单的技术选择，而是对Agent时代推理特征的判断：Agent需要低成本、快速、多步推理，任何被计算量锁死的方案都会在长context场景中失效。这一判断对小米自身的MiMo-V2架构选择有直接指导意义，也意味着其他选择MLA路线的玩家（主要是Chat时代的主流架构）需要重新评估技术路线。

实践启示¶

给AI研究者的建议¶

重新配置GPU资源：如果仍在按3:5:1配比投入Pre-train，需要重新评估——Agent时代应向Post-train/RL倾斜资源。
关注框架而非仅关注模型：OpenClaw的案例表明，框架创新可以跨越模型能力差距。在模型能力受限于硬件/预算时，一个好的框架可能是突破口。
Long Context是核心战场：把成本做到足够低、速度做到足够快，才能解锁真正的Agent场景。一兆token context不会是上限。
Skills获取是新研究方向：如何高效、低成本地从专家脑中提取Skills并转化为模型能力，是尚未被充分解决的难题。

给工程师/开发者的建议¶

优先学习Agent框架：相比钻研新模型架构，掌握OpenClaw类框架的使用和二次开发，能更快转化为生产力。
构建个人Skills资产：判断标准、经验、偏好这些"internal信息"是真正难以被复制的能力——在AI时代反而更有价值。
拥抱平权文化：扁平化的组织文化更有利于创新涌现，层级制度会压制 Agents 时代所需的快速迭代和群体协作。

给组织和战略决策者的建议¶

范式转移期是重新洗牌窗口：罗福莉的判断"上一个时代的成功并不意味着下一个时代的领先"是战略警句——在Agent时代，过去的技术积累可能反而成为路径依赖的来源。
开源社区是核心变量：谁的开源社区进步更快，谁就能在框架层占据优势。投资社区运营可能比单纯投资模型研发更杠杆。
基座能力仍有规模壁垒：1T参数门槛意味着完全依赖小模型+框架的策略存在上限风险，大规模基座能力建设不可忽视。
框架与模型需要协同设计：MiMo-V2的Pro+Omni+TTS三层架构表明，单一层面的优化（只有框架或只有模型）无法达到类人智能——需要系统级的协同设计。