Kimi Work：通用 Agent 战场从云端迁移到本地¶

Ch01.159 Kimi Work：通用 Agent 战场从云端迁移到本地¶

📊 Level ⭐⭐ | 39.2KB | entities/kimi-work-codex-vibe-working-paradigm-shift.md

Kimi Work：通用 Agent 战场从云端迁移到本地¶

"Vibe Coding 之后，下一个词是 Vibe Working。" —— 机器之心编辑部

Kimi Work 是月之暗面 K2.6 + Kimi Code Harness 搬到本地桌面的通用 Agent 产品（2026-06 Beta 发布）。与 OpenAI 把 Codex 并入 ChatGPT 同一时间发布，标志 "Vibe Working" 时代开启——AI Agent 主战场从写代码迁移到普通知识工作者的日常工作。

一句话定位¶

"AI 长任务的真正挑战，不再是上下文窗口有多长，而是 Harness 搭建得好不好。"—— Harness 决定一切

三个关键事件¶

① OpenAI：Codex 周活 500 万，并入 ChatGPT¶

数据：Codex 周活用户已突破 500 万，桌面版用户自 2 月上线后翻了 6 倍多
增长最快群体：不是程序员，而是知识工作者（做报告 / 做表格 / 做 PPT 的"普通白领"）—— 以开发者三倍以上的速度涌入，占全部用户约 20%
决策：未来几周内，Codex 的核心能力直接并入 ChatGPT——把执行利器塞进 ChatGPT 高频入口，走规模渗透路线

② Anthropic 提前布局¶

2 月：推出面向金融、工程等场景的企业 Agent 计划
5 月：上线深度面向金融行业的 Agent 产品

③ Kimi 发布 Kimi Work（Beta）¶

官方自评："还是个 Baby"
K2.6 模型参与共创，很快完成 Beta 版的开发与上线
核心定位："本地通用 Agent 模式"——Kimi 电脑客户端推出，面向更广泛的知识工作者
技术路径：Kimi Work 内核源自 Kimi Code Coding Agent——把 Harness 从程序员终端下放到通用桌面

5 大技术特性¶

① Harness 搬到用户电脑上（核心架构决策）¶

对比云端 Agent（Kimi 网页版 / OpenAI cloud sandbox / Google Project Mariner）： - 共同特点：在云端启动独立工作环境，帮用户把任务做完再交付结果 - 优势：安全隔离、易于部署 - 劣势：与用户真实工作环境的割裂——看不到本地文件、用不了用户账号、任务之间无记忆无上下文

Kimi Work 路线：Agent 住在本地、用你的环境、操作你的文件、带着你的登录状态去工作。理论上讲，本地 Agent 的边界 = 用户桌面工作的全部边界。

② Agent 集群：默认并行（最多 300 个分身）¶

核心理念："串行工作是人类受限于精力的默认设定，但 AI 天生就应该是并行的"。 - 测试版上线即支持 Agent 集群——最多可自主创建 300 个分身，同时处理多线程任务 - 一边跑数据、一边写材料、同时自动化处理流程

实测案例（新能源汽车融资调研）： - 4 个子 Agent（"研究员"）各自独立搜集信息，互不等待 - 完成后自动创建 2 个专职 Agent（数据清洗 + Excel 制作） - 整个过程不需要人工拆解任务、安排分工——它自己就把"项目管理"做掉了

③ Kimi WebBridge（浏览器桥接）¶

核心创新：直接操作用户当前正在使用的浏览器（包含用户自己的登录状态和习惯），而不是去新建一个空白的 AI 专用浏览器。

价值主张： - AI 直接"借用"你现有的浏览器环境——你登录过的账号、保存过的状态都直接成了它的资源 - 摩擦感降到最低 - 基本上你在浏览器上能做的 50% 的事情，它都能直接帮你操作

对比传统 AI 自动化： - 给 AI 一个专用沙盒浏览器（没账号没 Cookie）—— 安全但割裂 - 用户手动授权 + 配置 API——安全但摩擦 - WebBridge 思路：借用现有浏览器环境，摩擦感最低

④ 内置专业金融数据源¶

出厂自带：同花顺、天眼查、世界银行经济数据库等权威环境 - 金融人士无需再去头疼如何购买和配置各种 API——开箱即用 - 真实数据获取和处理流程（20 条工具调用 + 20 条命令），不是换说法的联网搜索

测试案例（英伟达股价分析）： - 不去联网搜索现成分析文章 - 真正调用数据源，20 个工具 / 20 条命令 - 11 页完整分析报告（股价走势 / 累计收益率 / 波动率分析）

⑤ "全部允许" 模式（类似 `--dangerously-skip-permissions`）¶

用户只需指定一个具体的项目文件夹，选择"全部允许"即可
Kimi 官方主张"足够安全，并不会超出文件夹行事"
建议：关键目录仍用"请求权限"模式

5 大测试场景实测¶

场景	任务	关键结果
调研	2025 年以来国内新能源汽车融资事件 → Excel	4 子 Agent 并行搜集 + 2 专职 Agent 清洗/制表
本地文件	近一个月"具身智能 + 机器人"选题分类	飞快完成，真实本地文件（无需上传/复制粘贴）
浏览器操控	通过 WebBridge 发微博	借用登录状态，50% 浏览器操作可自动化
长任务稳定性	30 位天才各 1000-3000 字演讲稿 + 日程	50+ 分钟、超时后自动重启动 + 断点续传、104 页 Word
金融数据源	英伟达 2023+ 股价分析	20 工具 / 20 命令，11 页报告，真实数据管道（非搜索）

30 位天才演讲稿任务的关键考验："长程连贯性"——前面选了哪 30 个人、每个人确立了什么风格基调，后面的撰写必须和这些设定保持一致。50 分钟、跨越数十个子任务，Kimi Work 没有出现前后矛盾，超时后选择继续而不是放弃。

长程连贯性的工程细节¶

莫扎特演讲稿超时 → 自动重启 → 断点续传： - 任务失败后自动重新启动 - 从断点继续完成后续内容（不是从头再来） - 进度不丢失

对 Beta 版的评价：在长达 50 分钟、跨越数十个子任务的执行链条里，Kimi Work 没有出现前后矛盾，也没有在超时后选择放弃——对于一个刚发布的 Beta 版产品来说，已经相当能打。

Vibe Coding → Vibe Working 范式转移¶

"Vibe Coding 让不懂编程的人开始用 AI 写代码。Vibe Working 想做的是让不懂技术的人开始用 AI 完成知识工作。"

"两者的核心逻辑是一样的：把执行权交给 AI，把判断权留给人。"

两条路： - OpenAI：把 Codex 这个执行利器并进 ChatGPT 这个高频入口 → 规模渗透路线 - Kimi：本地 Agent 住在桌面上 → 深度嵌入路线

"两条路都在通向同一个地方：一个 AI 真正参与知识工作日常流程的未来。那个未来，比大多数人预想的，要来得要早一些。"

模型公司在通用 Agent 上的天然优势¶

"只有同时掌握模型能力和 Agent 运行环境的公司，才能做到两者的深度协同：模型知道什么时候该调用什么工具，Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。"

Kimi 路径（不是临时起意）： - 2025-07：万亿参数开源模型 Kimi K2——国内最早一批将 Agentic Coding、工具调用和自主任务执行能力作为核心目标打造的基础模型之一 - 2025-09：内测 Agent 模式（代号"OK Computer"） - 2026-06：Kimi Work 发布——这条技术路径在桌面端的自然延伸

Kimi Work 的局限（官方自评）¶

任务失败时的恢复机制还需打磨
长时任务的中断与恢复还需完善
用户意图的准确理解还需提升
"还是个 Baby"——Beta 版自评

迭代速度：「Kimi Work 正以一天 N 版的速度迭代中」——发布本身不是表明产品多完善，而是这个方向上的竞争已经进入了一个新的速度节奏。

核心断言¶

"AI 长任务的真正挑战，不再是上下文窗口有多长，而是 Harness 搭建得好不好。"

"Vibe Coding 之后，下一个词是 Vibe Working。"

与现有 wiki 实体的关系¶

vs wow-harness v3 ¶

v3 = 跨 session 事件时间线 + 概念图（协议层治理）
Kimi Work = Harness 搬到本地桌面（运行环境层变革）
共同点：都在解决"AI Agent 如何与真实工作环境对接"问题

vs PilotDeck ¶

PilotDeck = WorkSpace + Always-on + Dream 模式（多项目隔离）
Kimi Work = 本地桌面 + 用户账号 + 真实文件（单桌面全场景）
共同点：都强调"AI 套上家"的工程范式

vs Agent Harness 架构 ¶

7 层 harness 模型是抽象框架
Kimi Work + WebBridge 是具体落地实现
文章强化："Harness 决定一切"——比模型能力重要

vs Rein ¶

Rein = 4 模块 + 5 类型边界（代码层架构）
Kimi Work = Harness 从云端到本地（部署层架构）
共同点：都在"防止上帝文件 / 防止环境割裂"层面做工程化

vs Codex 6 职位插件 ¶

之前 Codex 还在"加插件拓展能力"
现在 OpenAI 直接把 Codex 并入 ChatGPT——赛道战略转向

启示¶

Vibe Coding → Vibe Working 范式转移 —— AI Agent 主战场从代码迁移到知识工作（Codex 周活 500 万中白领增速 3 倍于开发者）
通用 Agent 战场从云端迁移到本地 —— 云端沙盒浏览器 vs 本地借用用户账号（WebBridge 思路胜出）
模型公司 + 自家 Harness = 不可复制的协同 —— 同时掌握模型 + Agent 运行环境的公司有天然优势
Agent 集群是默认而非开关 —— AI 天生并行（最多 300 个分身）
本地 Agent 边界 = 桌面工作全部边界 —— 文件、账号、状态、应用都成为可调用资源
金融数据源是"开箱即用"分水岭 —— 内置数据管道 vs 联网搜索摘抄，差别巨大
"一天 N 版"是 AI Agent 新节奏 —— Beta 版不再"打磨完美才发布"，速度胜过完整
Harness > 上下文窗口 —— AI 长任务的真正挑战是 Harness 搭建质量

局限 / 风险¶

Kimi Work 是 Beta 版，任务恢复 / 中断恢复 / 意图理解都还在打磨
"全部允许"模式（类似 --dangerously-skip-permissions）有潜在风险——用户需主动限制到具体文件夹
WebBridge 借用登录状态是双刃剑——便利性 vs 账号安全责任边界
300 个 Agent 并行的成本 / 限速 / 沙箱问题未在文章中详细披露
Codex 500 万周活 / 桌面版 6 倍数据来自 OpenAI 自报，缺第三方验证

第二来源补充：通用 Agent 一定来自模型公司¶

"只有同时掌握模型能力和 Agent 运行环境的公司，才能做到两者的深度协同：模型知道什么时候该调用什么工具，Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。"

Kimi Work 的自指证据 — 5 万行 / 92% / 一周¶

官方宣称 Kimi Work 的 Beta 版在一周内完成开发： - co-author = K2.6（Kimi 自己的模型） - 整个项目累计产出约 5 万行有效代码 - 92% 以上由 Kimi Code 自主生成 - 产品本身就在证明 Agent 的能力 - 今天很多 Agent 产品的开发和迭代方式：Anthropic 用 Claude Code 开发 Claude Code，OpenAI 用 codex 开发 codex - 某种意义上，Agent 在自我迭代和进化

Kimi 一年的 Agent 积累路径¶

Kimi 从 2025 年 7 月起做 Agent 模型的连贯路径： - 2025-07：发布万亿参数开源模型 K2（国内最早一批将 Agentic Coding / 工具调用 / 自主任务执行能力作为核心目标的基础模型） - 2025-09：内测 Agent 模式（代号"OK Computer"） - 2026-06：Kimi Work 发布 — 技术路径在桌面端的自然延伸 - 几乎一年的 Agent 产品经验积累 — 这是模型公司的结构性优势

"能并行的，就不要串行" 投研场景¶

典型场景：一个投研分析师需要追踪 20 家公司的最新财报数据，交叉比对行业趋势，最终产出研究报告

过去：一天甚至几天
Kimi Work：Agent 同时拆出多个分身
一边抓取财报
一边整理行业数据
一边起草报告框架
分析师角色从埋头执行变成审阅和判断

核心理念：AI 没必要沿着人类的串行工作习惯走。复杂任务可被拆成多个工作流同时推进（K2.5 模型就开始打磨的能力）。

赛博禅心测试：Kimi Work 抓取 887 篇文章¶

测试任务：抓取公众号"赛博禅心"后台全部 887 篇文章的数据（发布日期 / 标题 / 阅读数 / 点赞数 / 在看数 / 分享数），做一个可视化页面。

对比： - Claude Code（之前做过）：高铁上半个多小时，能跑通但更复杂，得稍微懂前端和数据处理 - Kimi Work（新做法）： - 接到任务后自己打开浏览器 - 发现数据动态加载 - 先尝试接口获取（发现信息不全） - 改为模拟人类逐页浏览 - 自主定位页面元素 - 逐条抓取数据 - 不需要用户写一行代码，也不需懂页面结构 - 最终抓完 887 篇全量数据 + 自动生成可交互数据看板

核心金句：Agent 要成为工作工具，就必须进入用户已经在使用的工具环境。

"最好的通用 Agent 一定来自模型公司" 论断¶

"通用 Agent 产品的质量，取决于模型能力和 Harness 之间的深度协同。Agent 在真实环境里连续完成任务，每一步的成功率、容错能力、上下文保持、工具调用的准确性，都需要模型和 Harness 联合优化。第三方开发者可以调用 API，但无法调整模型与环境之间的配合方式。一方模型公司可以同时优化两端，模型更懂环境，环境更适配模型。"

关键证据链： - Claude Code 每次升级，第三方模型的适配可能就要调整一次 - GPT-5.5 发布后，Codex 能力获得飞速提升（同源模型升级带动 harness 提升） - DeepSeek 开始招人做自己的 Agent（反向证据：模型公司意识到必须做 harness）

结论：想让自家模型发挥最大能力，一个适配自己的 harness 架构，对于模型公司来说也是必不可少的。

国内通用 Agent 竞争格局¶

视角拉远： - Kimi Work = 月之暗面通用 Agent 路线 - 豆包：即将上线付费（字节把 Agent 能力从免费试探推向正式产品化） - MiniMax Code：在路上（从 Coding Agent 切入的路径和 Kimi 类似）

2026 H2 最重要的方向转变： - 过去两年：国内基模公司竞争主要在模型能力层面（跑分 / 参数 / 上下文长度 / 推理速度） - 2026 H2 开始：转向真实知识工作场景 — 谁能持续运转 + 持续交付结果 - 这些是基础设施，不是产品；真正的产品竞争发生在真实工作场景里

核心断言：真正的模型即产品，不止取决于模型能力，还要看在模型之上，能交付出什么样的产品。

第二来源金句¶

"能并行的，就不要串行"
"Kimi Work 是用 Kimi Code 写的"（自指证据）
"Agent 要成为工作工具，就必须进入用户已经在使用的工具环境"
"只有同时掌握模型能力和 Agent 运行环境的公司，才能做到两者的深度协同"
"Claude Code 每次升级，第三方模型的适配可能就要调整一次"
"GPT-5.5 发布后，Codex 的能力获得飞速提升"
"真正的模型即产品，不止取决于模型能力"
基模公司的下一场仗，在知识工作场景里

深度分析¶

1. "Harness 搬到桌面"重构了 Agent 的能力边界¶

云端沙盒 Agent 的本质是一个任务托管环境——它与用户的桌面环境完全隔离，擅长处理"给定输入 → 产出一个结果"的独立任务。但这种架构天然存在一个边界：它无法感知用户的文件体系、无法使用用户的账号登录状态、无法在多个任务之间维持跨session的上下文积累。这意味着云端Agent适合执行离散的、一次性的任务，而不适合作为"日常工作流的一部分"嵌入知识工作。

Kimi Work 把 Harness 搬到本地桌面，实际上是把 Agent 从"任务托管商"变成了"桌面协作者"。当 Agent 住在用户的桌面环境里，它的可用工具集从"AI专用工具集"扩展到了"用户在桌面上能用的一切"——本地文件、浏览器标签页、已登录的SaaS账号、专业数据接口。这意味着 Agent 的能力天花板不再是模型能力，而是用户桌面工作的全部边界。

这一架构决策的战略意义在于：它选择了深度嵌入而非规模渗透。OpenAI 把 Codex 并入 ChatGPT，是把 AI 送进已有高频入口；Kimi 把 Agent 搬到桌面，是让 AI 成为用户桌面环境的"原生成员"。两条路径都通向同一个未来，但短期内的竞争维度不同。

2. WebBridge 的"借用"逻辑颠覆了 AI 自动化范式¶

AI 自动化领域的传统范式是隔离：给 AI 一个干净的沙盒环境，确保它不会接触到用户的真实账号和敏感数据。这在安全层面是合理的，但在使用层面造成了巨大的摩擦——用户需要重新配置 API、重新登录账号、重新建立数据管道。

WebBridge 的"借用"逻辑本质上是一个身份桥接设计：AI 不再是新环境的主人，而是用户现有环境的临时访客。它使用用户的已登录状态、借用人家的浏览器环境、把用户已有的数据资源作为自己的工具。这一逻辑将摩擦感降到最低：用户不需要做任何配置，只需要"允许"一次，AI 就能以用户的身份在用户的环境中工作。

这引出了一个重要的设计哲学问题：AI 自动化工具应该更像"用户"还是更像"系统管理员"？ 传统方案选择了后者（高权限独立账号），WebBridge 选择了前者（模拟用户在浏览器中的行为）。从 887 篇文章抓取的实际测试来看，WebBridge 的"模拟人类逐页浏览"路径比专用爬虫更稳健——前者不会被反爬机制拦截，后者会因为行为模式过于规律而被封禁。

这个"借用"逻辑的风险是双刃剑：便利性来源于 AI 拥有用户的身份权限，而这种身份权限的边界由浏览器安全模型决定，而非由 AI 产品本身决定。当 AI 能够"借用"用户登录状态完成微博发布，它同样可能"借用"同一会话完成其他操作——权限边界的控制完全依赖 AI 产品的内部约束设计。

3. Agent 集群是组织理论的结构性颠覆，不是功能升级¶

"最多 300 个分身"的 Agent 集群，其含义远不止于"并行处理更快"。从组织行为的视角来看，它是对人类工作组织的默认假设的根本性挑战。

传统知识工作组织的核心约束来自人类的注意力上限：一个人在同一时间只能处理一个复杂任务，因此组织结构必须设计成串行的流水线（分析师 → 整理师 → 写作者 → 审核人）。这种串行结构是人类认知局限的工程补偿，而非最优工作流的本质要求。

Agent 集群取消了这个约束。当一个任务可以被 AI 自动拆解为多个子工作流并行执行时，"项目管理"的角色开始被重新定义：不是人类在管理 AI 的分工，而是 AI 在自主决定何时并行、何时串行、何时创建新 Agent。尹 John 提出的"可燃型员工 vs 自燃型团队"比喻，精确地捕捉了这个转变的含义：传统 Agent 是一问一答（踢一脚动一下），Agent 集群是一声令下自行运转（一大群 AI 同时动起来）。

这意味着在 Agent 集群的工作模式下，人类角色从任务执行者转变为任务定义者和结果审阅者。分析师说"给我整理 20 家公司的财报"，AI 自主拆解任务、自行分配给 20 个并行 Agent、完成后汇总——分析师的精力从埋头执行变成了判断与审核。这个转变对组织设计的影响是深远的：当执行层被 AI 接管，"组织结构"的内涵将从"人的分工"变成"AI 工作流的编排方式"。

4. "模型即产品"的战略判断与基模公司的 Agent 军备竞赛¶

第二来源的核心论断"只有同时掌握模型能力和 Agent 运行环境的公司，才能做到两者的深度协同"，已经不再是一个理论推断，而是有实际产品迭代作为支撑的实证结论。

Kimi Work 的 Beta 版一周内完成开发、约 5 万行代码、92% 以上由 Kimi Code 自主生成——这本身就是一个自指闭环：产品即工具，工具即产品。OpenAI 的模式同样印证了这一点：GPT-5.5 发布后 Codex 能力飞速提升，同源模型升级直接带动 harness 能力跃升。这不是巧合——当模型和 harness 来自同一技术栈，联合优化的摩擦成本趋近于零，而外部集成商每次模型升级都需要重新适配。

DeepSeek 开始招人做自己的 Agent，是这个规律的反向证据：连最强调"开源"和"API 调用"的模型公司都意识到，不自己做 harness，自家模型的能力就无法在 Agent 场景里充分释放。2026 H2 开始，国内基模公司的竞争主战场从"模型能力跑分"转向"真实知识工作场景的持续交付能力"，谁能持续运转 + 持续交付结果，谁就把"模型即产品"变成了真实的竞争壁垒。

实践启示¶

1. 优先在"高重复、低创意"知识工作上部署本地 Agent¶

Vibe Working 最早的受益场景，不是需要深度判断的战略分析，而是高重复性、有明确输出标准、但人工执行耗时的知识工作。典型场景包括：同类竞品信息汇总、行业数据库结构化整理、定期财报数据提取与比对、标准格式报告批量生成。

这类场景的核心特征是：输入素材结构化程度高、输出格式相对固定、工作流程可拆解为并行子任务。Kimi Work 的 Agent 集群在 1224 个项目商机挖掘和 126 家 A 股低空经济分析中的实测已经验证了这类场景的可行性。对于组织来说，这意味着第一批 AI 替代的人力成本将首先出现在知识工作领域，而非制造或服务领域。

2. 构建"开箱即用"数据管道是本地 Agent 落地的关键基础设施¶

Kimi Work 内置同花顺、天眼查、Yahoo Finance、arXiv 等专业数据源，其战略意义不只是"减少配置摩擦"，而是重新定义了专业 AI Agent 的能力基线：能直接调用专业数据源 = 能交付达到专业标准的工作成果；只能联网搜索 = 只能交付参考级别的摘要。

对于行业从业者来说，这意味着本地 Agent 落地的关键投入不是模型选型，而是数据管道建设：组织内部有哪些专业数据库、SaaS 接口、数据供应商，需要先完成与 Agent 运行环境的对接，才能让 AI 真正产出达到工作标准的结果。一个配备了专业数据管道的 Kimi Work，远比一个只有模型能力但缺乏数据接入的云端 Agent 更有实用价值。

3. 评估组织是否准备好从"管一个人"转向"管一个团队"¶

Agent 集群的并行工作模式，对组织管理方式提出了新的要求。传统管理模式的核心假设是一个人执行一个任务、一个人汇报给一个上级；当 Agent 集群可以同时执行数十个并行任务时，管理者需要面对的问题不再是"如何分配任务给一个人"，而是"如何定义任务边界让 AI 自行组织分工"。

组织在引入 Agent 集群之前，需要评估：管理者是否具备将复杂工作流拆解为清晰任务边界的能力？组织是否有"任务定义"的文化积累（即是否能清楚描述"我要什么"而非"怎么做"）？如果答案是肯定的，Agent 集群可以成倍放大团队产能；如果答案是否定的，Agent 集群可能制造更多混乱而非效率。

4. 将"一天 N 版"迭代节奏纳入 AI 产品引进评估框架¶

Kimi Work 的 Beta 版发布策略——"一天 N 版迭代"、"不追求完美才发布"——代表了一种新的 AI 产品节奏。这个节奏与传统的"打磨成熟再发布"软件工程范式完全不同。它背后的逻辑是：在 AI Agent 领域，方向正确比功能完整更重要；Beta 版的用户反馈比内部测试更能指引迭代方向。

对于引进 AI 产品的企业来说，这意味着评估框架需要调整：不再以"产品是否成熟"作为引进标准，而是以"产品的迭代速度和技术方向是否与业务需求匹配"作为标准。同时，企业需要建立与"一天 N 版"节奏匹配的使用者反馈机制——Beta 版的价值来自用户实际使用中的问题发现，而非演示环境中的功能展示。

5. 把"云端 vs 本地"视为架构层战略选择，而非部署便利性差异¶

云端 Agent 与本地 Agent 的选择，不是"哪个更方便"的体验问题，而是数据主权、工作环境嵌入深度、长期 AI 战略的综合架构决策。云端方案适合"AI 即插即用"的轻量场景，适合对数据安全边界要求明确但不希望管理本地基础设施的组织；本地方案适合"AI 需要深度嵌入日常工作流"的战略场景，适合数据资产丰富、工作流程复杂且需要 AI 持续运行的行业。

对于已经有云端 AI 工具引入计划的企业来说，正确的问题不是"云端好还是本地好"，而是"这个工作流需要 AI 在我的工作环境里有多深地嵌入"。深度嵌入的工作流（如需要访问用户账号、本地文件、历史数据的工作），应该优先考虑本地方案；浅层接入的工作流（如提供参考建议、生成初稿的工作），云端方案足以应对。这个决策框架可以避免将"云端 vs 本地"变成一个意识形态之争，而是回到具体工作流的实际需求上做架构选择。

3rd 来源（2026-06-05）：AGI Hunt / 尹 John 视角 — 300 Agent 集群实战¶

"2026 年的 AI，已经忽略程序员了。"

作者：尹John（前网易资深技术专家；AI 初创公司 CTO；AGI Hunt 主理人）

3 源独家价值（前 2 source 完全没出现的）：

1. 独家数据：商机挖掘 1224 个项目漏斗¶

阶段	数量	细节
最终交付	1224 个项目	vs 单 Agent 偷懒（~20 个就放弃）
分组	97 组机会	自动任务拆解 + 预期管理
并行子 Agent	122 个	每个看 10 个项目
精选输出	50 个	程序员惯性要 .md 文件

独家金句：「卧槽，用户彻底怒了。」（单 Agent 偷懒被骂 vs Kimi Work 满交付的反差）

vs 机器之心版 (1st source)：机器之心版讲"新能源汽车融资调研 4 个子 Agent"（小规模），本版讲"商机挖掘 122 个子 Agent"（大规模集群）。独家证明 300 Agent 集群在大规模任务上的可行性。

2. 独家实战：PPT 制作 8 页 + "Executive Warmth" 主题¶

配色方案："Executive Warmth" 主题（灵感来自 Ralph Lauren + Cartier）
漏斗可视化：985 原始机会 → 291 初筛入围 → 50 最终精选（一页呈现）
12 大主题领域 + 关键指标 + 核心发现
售后自动化：自动保存到本机 + 自动打开

独家金句：「我主要做的事情是开头的几个字、后面的喝咖啡、以及最后索性去吃了个饭……」（Vibe Working 极致体现）

3. 独家比喻：可燃型员工 vs 自燃型团队¶

形态	行为	比喻
传统 Agent	一问一答	可燃型员工（踢一脚动一下）
Agent 集群	一声令下并行	自燃型团队（一大群 AI 同时干活）

独家金句：「如果 Vibe Coding 是用自然语言指挥 AI 写代码，那 Vibe Working 就是：你说了句话，一整个办公室的人（AI）开始同时动起来了。」

4. 独家对比：WebBridge vs 传统爬虫¶

方案	行为	风险
传统爬虫	程序化抓取	账号几天被封
WebBridge	模拟真人操作浏览器	安全（但禁止压力测试）

独家数据源对比： - Claude Code Computer Use / Codex 桌面操作：通用（无专业数据源） - Kimi Work 独家内置：同花顺 + 天眼查 + Yahoo Finance + arXiv（金融投研 + 学术检索）

5. 独家自指证据：90% 代码 Kimi Code 自生成¶

"Kimi Work 本身由 Kimi Code 辅助写出，其中 90% 以上的代码由 Kimi Code 自主生成。"

自指闭环：Agent 产品（Kimi Work）由它自己的 Agent 工具（Kimi Code）写出来 — 模型公司 + Coding Agent 协同的极致证明。

6. 独家数据：0.3% 全球付费 AI 用户¶

"地球上 81 亿人中付费使用 AI 的只有 0.3%。"

战略意义： - 99.7% 的人群尚未接触付费 AI - 知识工作者是 0.3% 内部的最大增长群体 - 解释了为什么 Coding Agent 厂商全部转向通用 Agent（Vibe Working）

7. 独家新场景：126 家 A 股低空经济公司炒股分析¶

5 个专业 Agent 并行：财务分析官 + 合规审计官 + 总编辑 + 业务关联官 + 证据核验官
工具：同花顺 Skill（读财务数据）+ 天眼查（穿透子公司和工商信息）
输出：概念真实性评分表 + 证据包 + 复核优先级清单 + PDF 主题审计报告

vs 1st source 英伟达股价分析（11 页报告）：本版 5 个专业 Agent 角色化分工 + 评分表 + 证据包，更接近真实投研工作流。

3 源整合后的实体价值¶

3 译本视角对照¶

来源	公众号	独家价值
1st	机器之心（Qyd8mHuR5）	Codex 500 万 / 知识工作者增速 3x / Harness 搬到本地 / 5 大技术特性 / 5 大实测场景
2nd	9号（ckzsd8QWz）	"通用 Agent 一定来自模型公司"战略判断 / 自家模型 vs 套壳 API 优劣 / 国内基模公司竞争格局
3rd	AGI Hunt / 尹 John	300 Agent 集群 1224 项目大数据 + PPT Executive Warmth 主题 + 可燃员工 vs 自燃团队比喻 + WebBridge vs 爬虫 + 0.3% 全球数据 + 90% 自生成自指

关键金句整合（3 源）¶

1st source： - "Vibe Coding 之后，下一个词是 Vibe Working" - "AI 长任务的真正挑战不再是上下文窗口有多长，而是 Harness 搭建得好不好"

2nd source： - "能并行的，就不要串行" - "Kimi Work 是用 Kimi Code 写的" - "真正的模型即产品，不止取决于模型能力"

3rd source： - "2026 年的 AI，已经忽略程序员了" - "可燃型员工 vs 自燃型团队" - "我主要做的事情是开头的几个字、后面的喝咖啡" - "Vibe Working 就是一整个办公室的人（AI）开始同时动起来了" - "全球 0.3% 付费 AI 用户"

3 源相互验证的关键事实¶

Codex 500 万周活 + 桌面版 2 月上线后翻 6 倍：1st source 独家
Anthropic 2 月企业 Agent 计划 + 5 月金融 Agent：1st source 独家
K2.6 模型 + Kimi Code 衍生 Kimi Work：3 源一致
WebBridge 内置数据源（同花顺/天眼查/Yahoo/arXiv）：1st + 3rd 一致
300 Agent 集群上限：1st + 3rd 一致
90% 代码 Kimi Code 自生成：3rd 独家自指证据
基模公司做 Agent 的天然优势：2nd + 3rd 一致

整合后 3 源的核心洞察¶

3 源覆盖的三大层次： 1. 产品层（1st）：Kimi Work 是什么 + 5 大技术特性 + 5 大实测场景 2. 战略层（2nd）：为什么是基模公司做 + 国内格局 + 真实工作场景竞争 3. 文化层（3rd）：Vibe Working 范式转变 + 300 Agent 集群大数实战 + 可燃员工 vs 自燃团队 + 90% 自生成自指

3 源整合的 v×c 总价值 ≈ 9×9 + 1×8 + 1×8 ≈ 95-100（9=product layer, 1=culture layer, 1=strategy layer）

Kimi Work：通用 Agent 战场从云端迁移到本地¶

Ch01.159 Kimi Work：通用 Agent 战场从云端迁移到本地¶

Kimi Work：通用 Agent 战场从云端迁移到本地¶

相关实体¶

一句话定位¶

三个关键事件¶

① OpenAI：Codex 周活 500 万，并入 ChatGPT¶

② Anthropic 提前布局¶

③ Kimi 发布 Kimi Work（Beta）¶

5 大技术特性¶

① Harness 搬到用户电脑上（核心架构决策）¶

② Agent 集群：默认并行（最多 300 个分身）¶

③ Kimi WebBridge（浏览器桥接）¶

④ 内置专业金融数据源¶

⑤ "全部允许" 模式（类似 --dangerously-skip-permissions）¶

5 大测试场景实测¶

长程连贯性的工程细节¶

Vibe Coding → Vibe Working 范式转移¶

模型公司在通用 Agent 上的天然优势¶

Kimi Work 的局限（官方自评）¶

核心断言¶

与现有 wiki 实体的关系¶

vs wow-harness v3¶

vs PilotDeck¶

vs Agent Harness 架构¶

vs Rein¶

vs Codex 6 职位插件¶

启示¶

局限 / 风险¶

相关对照¶

第二来源补充：通用 Agent 一定来自模型公司¶

Kimi Work 的自指证据 — 5 万行 / 92% / 一周¶

Kimi 一年的 Agent 积累路径¶

"能并行的，就不要串行" 投研场景¶

赛博禅心测试：Kimi Work 抓取 887 篇文章¶

"最好的通用 Agent 一定来自模型公司" 论断¶

国内通用 Agent 竞争格局¶

第二来源金句¶

深度分析¶

1. "Harness 搬到桌面"重构了 Agent 的能力边界¶

2. WebBridge 的"借用"逻辑颠覆了 AI 自动化范式¶

3. Agent 集群是组织理论的结构性颠覆，不是功能升级¶

4. "模型即产品"的战略判断与基模公司的 Agent 军备竞赛¶

实践启示¶

1. 优先在"高重复、低创意"知识工作上部署本地 Agent¶

2. 构建"开箱即用"数据管道是本地 Agent 落地的关键基础设施¶

3. 评估组织是否准备好从"管一个人"转向"管一个团队"¶

4. 将"一天 N 版"迭代节奏纳入 AI 产品引进评估框架¶

5. 把"云端 vs 本地"视为架构层战略选择，而非部署便利性差异¶

3rd 来源（2026-06-05）：AGI Hunt / 尹 John 视角 — 300 Agent 集群实战¶

1. 独家数据：商机挖掘 1224 个项目漏斗¶

2. 独家实战：PPT 制作 8 页 + "Executive Warmth" 主题¶

3. 独家比喻：可燃型员工 vs 自燃型团队¶

4. 独家对比：WebBridge vs 传统爬虫¶

5. 独家自指证据：90% 代码 Kimi Code 自生成¶

6. 独家数据：0.3% 全球付费 AI 用户¶

7. 独家新场景：126 家 A 股低空经济公司炒股分析¶

3 源整合后的实体价值¶

3 译本视角对照¶

关键金句整合（3 源）¶

3 源相互验证的关键事实¶

整合后 3 源的核心洞察¶

⑤ "全部允许" 模式（类似 `--dangerously-skip-permissions`）¶

vs wow-harness v3 ¶

vs PilotDeck ¶

vs Agent Harness 架构 ¶

vs Rein ¶

vs Codex 6 职位插件 ¶