A Guide to Which AI to Use in the Agentic Era¶
Ch01.474 A Guide to Which AI to Use in the Agentic Era¶
📊 Level ⭐⭐ | 7.4KB |
entities/a-guide-to-which-ai-to-use-in-the-agentic-era.md
A Guide to Which AI to Use in the Agentic Era¶
→ 原文存档
摘要¶
Ethan Mollick(沃顿商学院教授、AI 应用领域的权威声音)发布了他自 ChatGPT 以来的第八版 AI 使用指南,但这次代表了一个重大转折点:"使用 AI"的含义已经从"与聊天机器人对话"转变为"让 AI 作为 Agent 完成任务"。文章系统梳理了当前 AI 生态的三个关键维度——Models(模型)、Apps(应用)和 Harnesses(驾驭系统),并给出了面向不同用户层次的实操建议。
核心要点¶
-
Models / Apps / Harnesses 三分法 — 这是理解当前 AI 生态的核心框架。Models 是底层 AI 大脑(GPT-5.2、Claude Opus 4.6、Gemini 3 Pro),Apps 是用户界面(网站、桌面应用),Harnesses 是让模型能"做事"的系统(工具访问、多步任务执行)。同一模型在不同 Harness 下的表现可能天差地别。
-
三大前沿模型趋同 — Claude Opus 4.6、GPT-5.2 Thinking、Gemini 3 Pro 在整体能力上已相当接近。对大多数人而言,App 和 Harness 的差异比模型差异更重要。免费模型经过聊天优化,速度快但准确度显著低于付费模型。
-
手动选择模型至关重要 — 各厂商默认使用"auto"模式(通常分配较弱模型)。ChatGPT 需手动选 GPT-5.2 Thinking Extended/Heavy,Claude 需选 Opus 4.6 并开启 extended thinking,Gemini 需选 3 Pro 或 Thinking。这是提升 AI 工作质量的最简单操作。
-
Harness 是真正的差异化因素 — Claude Code 给模型提供了虚拟电脑、浏览器、终端,可以自主完成从研究到编码到测试的全流程。Mollick 分享了 Claude Code 在一小时内自主完成 80 卷 GPT-1 权重书籍的排版、封面设计、网站搭建和支付集成的案例。
-
Claude Cowork 开创桌面 Agent 范式 — Anthropic 发布的 Claude Cowork 是"非技术版 Claude Code",在桌面运行并直接操作本地文件和浏览器。它在 VM 中运行,具有默认拒绝网络和硬隔离安全机制,代表了 AI Agent 从编码场景向通用知识工作的扩展。
-
Chatbot 界面的分化 — Gemini 集成了 nano banana(图像生成)、Veo 3.1(视频生成)、Guided Learning;ChatGPT 集成了图像生成、Deep Research、Shopping Research;Claude 仅集成了 Deep Research,但 Claude Desktop 提供了 Code + Cowork 的强大组合。
深度分析¶
Models / Apps / Harnesses 框架的深层含义¶
Mollick 的三分法是理解当前 AI 生态最实用的分析框架。它的核心洞察是:模型能力正在快速商品化,差异化竞争正在从模型层向 Harness 层迁移。
这一趋势与 Agent Harness 概念高度吻合。Harness 的本质是将原始模型能力转化为可执行的工作流——就像马具将马的力量转化为耕地或拉车的能力。Claude Code 的"虚拟电脑 + 终端 + 浏览器"、Claude Cowork 的"桌面操作 + 文件系统访问"、NotebookLM 的"知识库 + 播客生成"都是不同形态的 Harness。
各厂商的 Harness 策略对比¶
| 维度 | Anthropic | OpenAI | |
|---|---|---|---|
| 编码 Harness | Claude Code | Codex | Antigravity |
| 桌面 Agent | Claude Cowork | — | — |
| 办公集成 | Excel/PPT 插件 | — | Sheets 集成 |
| 知识工具 | Deep Research | Deep Research + Shopping | NotebookLM + Deep Research |
| 安全模型 | VM 隔离 + 默认拒绝网络 | — | — |
Anthropic 在 Harness 层的布局最为完整——从编码(Code)到通用桌面(Cowork)到办公(Excel/PPT),形成了覆盖开发者和非技术用户的全栈 Agent 产品线。这与 Claude Code 的架构分析 中揭示的设计理念一脉相承。
"AI 做事" vs "AI 说话" 的范式转移¶
Mollick 指出的核心转变是:"an AI that does things is fundamentally more useful than an AI that says things"。这不仅是用户体验的变化,更是 AI 应用架构的根本性重构:
- 从 prompt engineering 到 harness engineering:用户的工作从"如何描述问题"变为"如何配置和管理 Agent 的工作环境"
- 从单轮对话到多步执行:Agent 可以自主规划、执行、检查、重试,用户从"操作者"变为"管理者"
- 从文本输出到结构化产出:Agent 可以直接生成文件、表格、网站、代码,而非仅返回文本建议
NotebookLM 的独特价值¶
在众多工具中,NotebookLM 值得特别关注。它解决了一个其他工具都没有很好解决的问题:如何让 AI 帮助理解大量信息。通过构建交互式知识库并支持多种输出形式(slides、mind maps、podcasts),它在研究和学习场景中具有独特的价值。
OpenClaw 的警示意义¶
OpenClaw 代表了 AI Agent 的一个极端方向——24/7 个人助手,具有对电脑和账户的广泛访问权限。Mollick 明确警告"you almost definitely shouldn't use"它,因为它带来了严重的安全风险。这与 Claude Cowork 的"VM 隔离 + 默认拒绝网络"形成鲜明对比,揭示了 Agent 安全设计的重要性。
实践启示¶
- 入门策略:选择 ChatGPT/Claude/Gemini 之一,付费 $20/月,手动选择最强模型(不要用默认的 auto 模式)。这一简单操作就能显著提升 AI 工作质量
- 进阶路径:从聊天机器人进阶到 Agent 工具。NotebookLM 免费且易用,适合作为起点;Claude Desktop(Code + Cowork)是最强大的进阶选择
- 管理思维:从"prompting"转向"managing"——描述目标、审查产出、在出错时纠偏,而非逐句指导 AI 操作
- Harness 选型:根据工作类型选择合适的 Harness。编码选 Claude Code / Codex,知识工作选 Claude Cowork,研究选 NotebookLM,不要期望一个工具满足所有需求
- 安全意识:使用 Agent 工具时关注其安全模型。优先选择有明确隔离机制的产品,谨慎授予 AI 对本地文件和账户的访问权限
相关实体¶
- Claude Code
- Claude Opus 4.8 System Card
- NotebookLM
- Agent Harness
- Karpathy: Agentic Engineering
- MOC: Prompt Engineering