跳转至

管理作为 AI 超级能力:Mollick 的 Agentic Work Delegation 方程

Ch04.273 管理作为 AI 超级能力:Mollick 的 Agentic Work Delegation 方程

📊 Level ⭐⭐ | 9.0KB | entities/management-as-ai-superpower-mollick.md

管理作为 AI 超级能力:Mollick 的 Agentic Work Delegation 方程

2026-06-07 引用自 Ethan Mollick《Management as AI superpower》,One Useful Thing,2026-01-27。

沃顿 MBA 四天创业挑战赛

Mollick 在 Penn 教授一门实验课:MBA 学生(大多数没写过代码)四天内从零开始构建创业公司原型。使用工具:Claude Code + Google Antigravity(构建原型)+ ChatGPT/Claude/Gemini(市场调研/竞品分析/pitch/财务模型)。

结果:比传统一学期课程推进了一个数量级的进度——原型不只是示例屏幕,而是有核心功能实际运行;创意远比通常更有趣;市场分析有深度。

关键发现:学生不是 AI 专家,但他们懂管理

Agentic Work delegation 方程

Mollick 提出 delegation 是否值得的三个变量:

变量 定义 说明
Human Baseline Time(人类基准时间) 任务人类自己完成需多久 10 小时任务 vs 1 小时任务决策不同
Probability of Success(成功率) AI 单次输出达到标准的概率 GPT-5.2 Thinking 在 GDPval 达 72%
AI Process Time(AI 流程时间) prompt + 等待 + 评估输出的总时间 每次迭代约 30 分钟(prompt 编写 + 等候 + 检查)

核心逻辑:用 AI 做完整体任务(Human Baseline Time) vs 支付 overhead(AI Process Time,可能多次直到成功)。成功率高 → fewer iterations → delegation 有价值。

实际计算(GPT-5.2 Thinking,72% 成功率): - 7 小时任务:AI 节省约 3 小时平均(失败任务反而更耗时,但成功任务快得多)

让 delegation 更有价值的三个杠杆

  1. 给更好指令(提高成功率):清晰目标 + 具体边界 + "done" 定义
  2. 更好反馈(减少迭代次数):有效评估 + 精确纠错
  3. 更快评估(降低 overhead):快速识别 AI 输出质量,无需深入检查就知道好坏

共同前提:领域专业知识——专家知道给什么指令、能看到问题在哪、知道如何纠正。

管理文档就是 AI Prompt

各行业早已发明了 delegation 文档: - PRD(Product Requirements Documents) - 导演的 shot lists - 建筑师的设计意图文档 - Marines 的 Five Paragraph Orders - 咨询师的项目范围说明

共同结构: - 我们的目标是什么,为什么? - 授权边界在哪里? - "完成"什么样? - 需要什么具体输出? - 需要什么中间检查点? - 完成前需要确认什么?

AI 可以一次处理大量指令,这些文档格式直接可用。

管理 101 = AI Agent 协作技能

Mollick 观察到 AI 实验室的程序员工作正在从"mostly programming"变成"mostly management of AI agents"。

MBA 学生成功的原因: - 他们花多年学习在各自领域 scoped problems - 他们能定义 deliverables - 他们能识别财务模型/医学报告何时出错 - 他们的管理框架成为他们的 prompts

"The skills that are so often dismissed as 'soft' turned out to be the hard ones."

AI 时代稀缺的不再是"人才"(AI 是 abundant and cheap),而是知道要什么的人。

GDPval 数据支持

GPT-5.2 Thinking/Pro 在 GDPval 真实专家任务上 72% 的时间持平或击败人类专家(4-7 小时任务)。

深度分析

1. "管理 AI"作为核心能力的范式确认

Mollick 的论点——管理 AI 的能力比编程 AI 的能力更重要——标志着 AI 技能讨论从"如何使用 AI"转向"如何管理 AI"。这与 Co Existence Paradigm Shift Agentic Ai Mollick 2026 中的 Co-Existence 范式一致:当 AI 自主执行时,人类的核心价值从"做"转向"管"。

2. 72% 击败人类专家的实验设计意义

AI 在 4-7 小时任务中 72% 的时间持平或击败人类专家——这一数据的含义取决于比较基线。如果基线是"普通人类",则 AI 已在某些领域超越中位数;如果基线是"顶尖专家",则 AI 仍在追赶。Mollick 的表述暗示前者,但精确的比较维度(速度、质量、成本)需要进一步澄清。

3. 管理技能的可迁移性

管理 AI 的技能是否可从管理人类迁移?Mollick 隐含的假设是肯定的——分解任务、评估输出、提供反馈、迭代改进。但 AI 的失败模式(hallucination、过度遵从、缺乏常识)与人类完全不同,需要专门的管理策略。

4. "超级能力"隐喻的双重含义

"管理作为 AI 超级能力"既意味着"掌握 AI 管理的人获得超级能力",也意味着"AI 使管理本身成为超级能力"。前者强调人的差异化,后者强调管理职能的放大。两者在组织设计上有不同含义。

5. 对组织架构的影响

如果管理 AI 是核心能力,组织结构应围绕"谁在管理 AI"而非"谁在编程 AI"设计。这意味着中层管理者的角色可能比技术专家更重要——他们是 AI 输出的守门人。

实践启示

1. 管理者:将 AI 管理技能纳入绩效评估

在团队绩效评估中加入"AI 输出质量"维度——不是测 AI 能做什么,而是测管理者能否有效地分配、监督和迭代 AI 的工作。

2. 技术专家:学习管理 AI 而非只学技术

编程 AI 的技能正在被 AI 自身自动化(Claude Code/Codex)。更具持久价值的是管理 AI 的技能——任务分解、质量评估、反馈循环设计。

3. 组织:重新定义"AI 素养"

AI 素养不应仅包含"如何使用 ChatGPT",还应包含"如何评估 AI 输出质量"、"如何在人机协作中分配决策权"、"如何设计 AI 工作流的检查点"。

4. 招聘:重视 AI 管理经验而非 AI 编程经验

在招聘中,评估候选人的 AI 管理经验(output curation、任务委托、质量把关)比评估 AI 编程经验(prompt engineering、API 集成)更能预测长期价值。

5. 研究:量化"管理 AI"的技能维度

当前缺乏对"管理 AI"技能的系统性框架和量化指标。建议从任务分解能力、输出评估准确率、反馈循环效率三个维度建立评估体系。

关键引用

"I don't know exactly what work looks like when everyone is a manager with an army of tireless agents. But I suspect the people who thrive will be the ones who know what good looks like — and can explain it clearly enough that even an AI can deliver it."

"All that training, it turns out, was accidentally preparing them for exactly this moment."

相关主题