跳转至

Kimi Work:通用 Agent 战场从云端迁移到本地

Ch01.159 Kimi Work:通用 Agent 战场从云端迁移到本地

📊 Level ⭐⭐ | 39.2KB | entities/kimi-work-codex-vibe-working-paradigm-shift.md

Kimi Work:通用 Agent 战场从云端迁移到本地

"Vibe Coding 之后,下一个词是 Vibe Working。" —— 机器之心编辑部

Kimi Work月之暗面 K2.6 + Kimi Code Harness 搬到本地桌面的通用 Agent 产品(2026-06 Beta 发布)。与 OpenAI 把 Codex 并入 ChatGPT 同一时间发布,标志 "Vibe Working" 时代开启——AI Agent 主战场从写代码迁移到普通知识工作者的日常工作

相关实体

原文存档

一句话定位

"AI 长任务的真正挑战,不再是上下文窗口有多长,而是 Harness 搭建得好不好。"—— Harness 决定一切

三个关键事件

① OpenAI:Codex 周活 500 万,并入 ChatGPT

  • 数据:Codex 周活用户已突破 500 万,桌面版用户自 2 月上线后翻了 6 倍多
  • 增长最快群体不是程序员,而是知识工作者(做报告 / 做表格 / 做 PPT 的"普通白领")—— 以开发者三倍以上的速度涌入,占全部用户约 20%
  • 决策未来几周内,Codex 的核心能力直接并入 ChatGPT——把执行利器塞进 ChatGPT 高频入口,走规模渗透路线

② Anthropic 提前布局

  • 2 月:推出面向金融、工程等场景的企业 Agent 计划
  • 5 月:上线深度面向金融行业的 Agent 产品

③ Kimi 发布 Kimi Work(Beta)

  • 官方自评:"还是个 Baby"
  • K2.6 模型参与共创,很快完成 Beta 版的开发与上线
  • 核心定位"本地通用 Agent 模式"——Kimi 电脑客户端推出,面向更广泛的知识工作者
  • 技术路径:Kimi Work 内核源自 Kimi Code Coding Agent——把 Harness 从程序员终端下放到通用桌面

5 大技术特性

① Harness 搬到用户电脑上(核心架构决策)

对比云端 Agent(Kimi 网页版 / OpenAI cloud sandbox / Google Project Mariner): - 共同特点:在云端启动独立工作环境,帮用户把任务做完再交付结果 - 优势:安全隔离、易于部署 - 劣势:与用户真实工作环境的割裂——看不到本地文件、用不了用户账号、任务之间无记忆无上下文

Kimi Work 路线Agent 住在本地、用你的环境、操作你的文件、带着你的登录状态去工作。理论上讲,本地 Agent 的边界 = 用户桌面工作的全部边界。

② Agent 集群:默认并行(最多 300 个分身)

核心理念:"串行工作是人类受限于精力的默认设定,但 AI 天生就应该是并行的"。 - 测试版上线即支持 Agent 集群——最多可自主创建 300 个分身,同时处理多线程任务 - 一边跑数据、一边写材料、同时自动化处理流程

实测案例(新能源汽车融资调研): - 4 个子 Agent("研究员")各自独立搜集信息,互不等待 - 完成后自动创建 2 个专职 Agent(数据清洗 + Excel 制作) - 整个过程不需要人工拆解任务、安排分工——它自己就把"项目管理"做掉了

③ Kimi WebBridge(浏览器桥接)

核心创新直接操作用户当前正在使用的浏览器(包含用户自己的登录状态和习惯),而不是去新建一个空白的 AI 专用浏览器。

价值主张: - AI 直接"借用"你现有的浏览器环境——你登录过的账号、保存过的状态都直接成了它的资源 - 摩擦感降到最低 - 基本上你在浏览器上能做的 50% 的事情,它都能直接帮你操作

对比传统 AI 自动化: - 给 AI 一个专用沙盒浏览器(没账号没 Cookie)—— 安全但割裂 - 用户手动授权 + 配置 API——安全但摩擦 - WebBridge 思路:借用现有浏览器环境,摩擦感最低

④ 内置专业金融数据源

出厂自带:同花顺、天眼查、世界银行经济数据库等权威环境 - 金融人士无需再去头疼如何购买和配置各种 API——开箱即用 - 真实数据获取和处理流程(20 条工具调用 + 20 条命令),不是换说法的联网搜索

测试案例(英伟达股价分析): - 不去联网搜索现成分析文章 - 真正调用数据源,20 个工具 / 20 条命令 - 11 页完整分析报告(股价走势 / 累计收益率 / 波动率分析)

⑤ "全部允许" 模式(类似 --dangerously-skip-permissions

  • 用户只需指定一个具体的项目文件夹,选择"全部允许"即可
  • Kimi 官方主张"足够安全,并不会超出文件夹行事"
  • 建议:关键目录仍用"请求权限"模式

5 大测试场景实测

场景 任务 关键结果
调研 2025 年以来国内新能源汽车融资事件 → Excel 4 子 Agent 并行搜集 + 2 专职 Agent 清洗/制表
本地文件 近一个月"具身智能 + 机器人"选题分类 飞快完成,真实本地文件(无需上传/复制粘贴)
浏览器操控 通过 WebBridge 发微博 借用登录状态,50% 浏览器操作可自动化
长任务稳定性 30 位天才各 1000-3000 字演讲稿 + 日程 50+ 分钟、超时后自动重启动 + 断点续传、104 页 Word
金融数据源 英伟达 2023+ 股价分析 20 工具 / 20 命令,11 页报告真实数据管道(非搜索)

30 位天才演讲稿任务的关键考验:"长程连贯性"——前面选了哪 30 个人、每个人确立了什么风格基调,后面的撰写必须和这些设定保持一致。50 分钟、跨越数十个子任务,Kimi Work 没有出现前后矛盾,超时后选择继续而不是放弃

长程连贯性的工程细节

莫扎特演讲稿超时 → 自动重启 → 断点续传: - 任务失败后自动重新启动 - 从断点继续完成后续内容(不是从头再来) - 进度不丢失

对 Beta 版的评价:在长达 50 分钟、跨越数十个子任务的执行链条里,Kimi Work 没有出现前后矛盾,也没有在超时后选择放弃——对于一个刚发布的 Beta 版产品来说,已经相当能打

Vibe Coding → Vibe Working 范式转移

"Vibe Coding 让不懂编程的人开始用 AI 写代码。Vibe Working 想做的是让不懂技术的人开始用 AI 完成知识工作。"

"两者的核心逻辑是一样的:把执行权交给 AI,把判断权留给人。"

两条路: - OpenAI:把 Codex 这个执行利器并进 ChatGPT 这个高频入口 → 规模渗透路线 - Kimi:本地 Agent 住在桌面上 → 深度嵌入路线

"两条路都在通向同一个地方:一个 AI 真正参与知识工作日常流程的未来。那个未来,比大多数人预想的,要来得要早一些。"

模型公司在通用 Agent 上的天然优势

"只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同:模型知道什么时候该调用什么工具,Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。"

Kimi 路径(不是临时起意): - 2025-07:万亿参数开源模型 Kimi K2——国内最早一批将 Agentic Coding、工具调用和自主任务执行能力作为核心目标打造的基础模型之一 - 2025-09:内测 Agent 模式(代号"OK Computer") - 2026-06:Kimi Work 发布——这条技术路径在桌面端的自然延伸

Kimi Work 的局限(官方自评)

  • 任务失败时的恢复机制还需打磨
  • 长时任务的中断与恢复还需完善
  • 用户意图的准确理解还需提升
  • "还是个 Baby"——Beta 版自评

迭代速度:「Kimi Work 正以一天 N 版的速度迭代中」——发布本身不是表明产品多完善,而是这个方向上的竞争已经进入了一个新的速度节奏

核心断言

"AI 长任务的真正挑战,不再是上下文窗口有多长,而是 Harness 搭建得好不好。"

"Vibe Coding 之后,下一个词是 Vibe Working。"

与现有 wiki 实体的关系

vs wow-harness v3

  • v3 = 跨 session 事件时间线 + 概念图(协议层治理)
  • Kimi Work = Harness 搬到本地桌面(运行环境层变革)
  • 共同点:都在解决"AI Agent 如何与真实工作环境对接"问题

vs PilotDeck

  • PilotDeck = WorkSpace + Always-on + Dream 模式(多项目隔离
  • Kimi Work = 本地桌面 + 用户账号 + 真实文件单桌面全场景
  • 共同点:都强调"AI 套上家"的工程范式

vs Agent Harness 架构

  • 7 层 harness 模型是抽象框架
  • Kimi Work + WebBridge 是具体落地实现
  • 文章强化:"Harness 决定一切"——比模型能力重要

vs Rein

  • Rein = 4 模块 + 5 类型边界(代码层架构)
  • Kimi Work = Harness 从云端到本地(部署层架构)
  • 共同点:都在"防止上帝文件 / 防止环境割裂"层面做工程化

vs Codex 6 职位插件

  • 之前 Codex 还在"加插件拓展能力"
  • 现在 OpenAI 直接把 Codex 并入 ChatGPT——赛道战略转向

启示

  1. Vibe Coding → Vibe Working 范式转移 —— AI Agent 主战场从代码迁移到知识工作(Codex 周活 500 万中白领增速 3 倍于开发者
  2. 通用 Agent 战场从云端迁移到本地 —— 云端沙盒浏览器 vs 本地借用用户账号(WebBridge 思路胜出)
  3. 模型公司 + 自家 Harness = 不可复制的协同 —— 同时掌握模型 + Agent 运行环境的公司有天然优势
  4. Agent 集群是默认而非开关 —— AI 天生并行(最多 300 个分身)
  5. 本地 Agent 边界 = 桌面工作全部边界 —— 文件、账号、状态、应用都成为可调用资源
  6. 金融数据源是"开箱即用"分水岭 —— 内置数据管道 vs 联网搜索摘抄,差别巨大
  7. "一天 N 版"是 AI Agent 新节奏 —— Beta 版不再"打磨完美才发布",速度胜过完整
  8. Harness > 上下文窗口 —— AI 长任务的真正挑战是 Harness 搭建质量

局限 / 风险

  • Kimi Work 是 Beta 版,任务恢复 / 中断恢复 / 意图理解都还在打磨
  • "全部允许"模式(类似 --dangerously-skip-permissions)有潜在风险——用户需主动限制到具体文件夹
  • WebBridge 借用登录状态是双刃剑——便利性 vs 账号安全责任边界
  • 300 个 Agent 并行的成本 / 限速 / 沙箱问题未在文章中详细披露
  • Codex 500 万周活 / 桌面版 6 倍数据来自 OpenAI 自报,缺第三方验证

相关对照

原文存档

第二来源补充:通用 Agent 一定来自模型公司

"只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同:模型知道什么时候该调用什么工具,Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。"

Kimi Work 的自指证据 — 5 万行 / 92% / 一周

官方宣称 Kimi Work 的 Beta 版在一周内完成开发: - co-author = K2.6(Kimi 自己的模型) - 整个项目累计产出约 5 万行有效代码 - 92% 以上由 Kimi Code 自主生成 - 产品本身就在证明 Agent 的能力 - 今天很多 Agent 产品的开发和迭代方式:Anthropic 用 Claude Code 开发 Claude Code,OpenAI 用 codex 开发 codex - 某种意义上,Agent 在自我迭代和进化

Kimi 一年的 Agent 积累路径

Kimi 从 2025 年 7 月起做 Agent 模型的连贯路径: - 2025-07:发布万亿参数开源模型 K2(国内最早一批将 Agentic Coding / 工具调用 / 自主任务执行能力作为核心目标的基础模型) - 2025-09:内测 Agent 模式(代号"OK Computer") - 2026-06:Kimi Work 发布 — 技术路径在桌面端的自然延伸 - 几乎一年的 Agent 产品经验积累 — 这是模型公司的结构性优势

"能并行的,就不要串行" 投研场景

典型场景:一个投研分析师需要追踪 20 家公司的最新财报数据,交叉比对行业趋势,最终产出研究报告

  • 过去:一天甚至几天
  • Kimi Work:Agent 同时拆出多个分身
  • 一边抓取财报
  • 一边整理行业数据
  • 一边起草报告框架
  • 分析师角色从埋头执行变成审阅和判断

核心理念AI 没必要沿着人类的串行工作习惯走。复杂任务可被拆成多个工作流同时推进(K2.5 模型就开始打磨的能力)。

赛博禅心测试:Kimi Work 抓取 887 篇文章

测试任务:抓取公众号"赛博禅心"后台全部 887 篇文章的数据(发布日期 / 标题 / 阅读数 / 点赞数 / 在看数 / 分享数),做一个可视化页面。

对比: - Claude Code(之前做过):高铁上半个多小时,能跑通但更复杂,得稍微懂前端和数据处理 - Kimi Work(新做法): - 接到任务后自己打开浏览器 - 发现数据动态加载 - 先尝试接口获取(发现信息不全) - 改为模拟人类逐页浏览 - 自主定位页面元素 - 逐条抓取数据 - 不需要用户写一行代码,也不需懂页面结构 - 最终抓完 887 篇全量数据 + 自动生成可交互数据看板

核心金句Agent 要成为工作工具,就必须进入用户已经在使用的工具环境

"最好的通用 Agent 一定来自模型公司" 论断

"通用 Agent 产品的质量,取决于模型能力和 Harness 之间的深度协同。Agent 在真实环境里连续完成任务,每一步的成功率、容错能力、上下文保持、工具调用的准确性,都需要模型和 Harness 联合优化。第三方开发者可以调用 API,但无法调整模型与环境之间的配合方式。一方模型公司可以同时优化两端,模型更懂环境,环境更适配模型。"

关键证据链: - Claude Code 每次升级,第三方模型的适配可能就要调整一次 - GPT-5.5 发布后,Codex 能力获得飞速提升(同源模型升级带动 harness 提升) - DeepSeek 开始招人做自己的 Agent(反向证据:模型公司意识到必须做 harness)

结论想让自家模型发挥最大能力,一个适配自己的 harness 架构,对于模型公司来说也是必不可少的

国内通用 Agent 竞争格局

视角拉远: - Kimi Work = 月之暗面 通用 Agent 路线 - 豆包:即将上线付费(字节把 Agent 能力从免费试探推向正式产品化) - MiniMax Code:在路上(从 Coding Agent 切入的路径和 Kimi 类似)

2026 H2 最重要的方向转变: - 过去两年:国内基模公司竞争主要在模型能力层面(跑分 / 参数 / 上下文长度 / 推理速度) - 2026 H2 开始:转向真实知识工作场景 — 谁能持续运转 + 持续交付结果 - 这些是基础设施,不是产品真正的产品竞争发生在真实工作场景里

核心断言真正的模型即产品,不止取决于模型能力,还要看在模型之上,能交付出什么样的产品

第二来源金句

  • "能并行的,就不要串行"
  • "Kimi Work 是用 Kimi Code 写的"(自指证据)
  • "Agent 要成为工作工具,就必须进入用户已经在使用的工具环境"
  • "只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同"
  • "Claude Code 每次升级,第三方模型的适配可能就要调整一次"
  • "GPT-5.5 发布后,Codex 的能力获得飞速提升"
  • "真正的模型即产品,不止取决于模型能力"
  • 基模公司的下一场仗,在知识工作场景里

深度分析

1. "Harness 搬到桌面"重构了 Agent 的能力边界

云端沙盒 Agent 的本质是一个任务托管环境——它与用户的桌面环境完全隔离,擅长处理"给定输入 → 产出一个结果"的独立任务。但这种架构天然存在一个边界:它无法感知用户的文件体系、无法使用用户的账号登录状态、无法在多个任务之间维持跨session的上下文积累。这意味着云端Agent适合执行离散的、一次性的任务,而不适合作为"日常工作流的一部分"嵌入知识工作。

Kimi Work 把 Harness 搬到本地桌面,实际上是把 Agent 从"任务托管商"变成了"桌面协作者"。 当 Agent 住在用户的桌面环境里,它的可用工具集从"AI专用工具集"扩展到了"用户在桌面上能用的一切"——本地文件、浏览器标签页、已登录的SaaS账号、专业数据接口。这意味着 Agent 的能力天花板不再是模型能力,而是用户桌面工作的全部边界。

这一架构决策的战略意义在于:它选择了深度嵌入而非规模渗透。OpenAI 把 Codex 并入 ChatGPT,是把 AI 送进已有高频入口;Kimi 把 Agent 搬到桌面,是让 AI 成为用户桌面环境的"原生成员"。两条路径都通向同一个未来,但短期内的竞争维度不同。

2. WebBridge 的"借用"逻辑颠覆了 AI 自动化范式

AI 自动化领域的传统范式是隔离:给 AI 一个干净的沙盒环境,确保它不会接触到用户的真实账号和敏感数据。这在安全层面是合理的,但在使用层面造成了巨大的摩擦——用户需要重新配置 API、重新登录账号、重新建立数据管道。

WebBridge 的"借用"逻辑本质上是一个身份桥接设计:AI 不再是新环境的主人,而是用户现有环境的临时访客。它使用用户的已登录状态、借用人家的浏览器环境、把用户已有的数据资源作为自己的工具。这一逻辑将摩擦感降到最低:用户不需要做任何配置,只需要"允许"一次,AI 就能以用户的身份在用户的环境中工作。

这引出了一个重要的设计哲学问题:AI 自动化工具应该更像"用户"还是更像"系统管理员"? 传统方案选择了后者(高权限独立账号),WebBridge 选择了前者(模拟用户在浏览器中的行为)。从 887 篇文章抓取的实际测试来看,WebBridge 的"模拟人类逐页浏览"路径比专用爬虫更稳健——前者不会被反爬机制拦截,后者会因为行为模式过于规律而被封禁。

这个"借用"逻辑的风险是双刃剑:便利性来源于 AI 拥有用户的身份权限,而这种身份权限的边界由浏览器安全模型决定,而非由 AI 产品本身决定。当 AI 能够"借用"用户登录状态完成微博发布,它同样可能"借用"同一会话完成其他操作——权限边界的控制完全依赖 AI 产品的内部约束设计。

3. Agent 集群是组织理论的结构性颠覆,不是功能升级

"最多 300 个分身"的 Agent 集群,其含义远不止于"并行处理更快"。从组织行为的视角来看,它是对人类工作组织的默认假设的根本性挑战。

传统知识工作组织的核心约束来自人类的注意力上限:一个人在同一时间只能处理一个复杂任务,因此组织结构必须设计成串行的流水线(分析师 → 整理师 → 写作者 → 审核人)。这种串行结构是人类认知局限的工程补偿,而非最优工作流的本质要求。

Agent 集群取消了这个约束。当一个任务可以被 AI 自动拆解为多个子工作流并行执行时,"项目管理"的角色开始被重新定义:不是人类在管理 AI 的分工,而是 AI 在自主决定何时并行、何时串行、何时创建新 Agent。 尹 John 提出的"可燃型员工 vs 自燃型团队"比喻,精确地捕捉了这个转变的含义:传统 Agent 是一问一答(踢一脚动一下),Agent 集群是一声令下自行运转(一大群 AI 同时动起来)。

这意味着在 Agent 集群的工作模式下,人类角色从任务执行者转变为任务定义者和结果审阅者。分析师说"给我整理 20 家公司的财报",AI 自主拆解任务、自行分配给 20 个并行 Agent、完成后汇总——分析师的精力从埋头执行变成了判断与审核。这个转变对组织设计的影响是深远的:当执行层被 AI 接管,"组织结构"的内涵将从"人的分工"变成"AI 工作流的编排方式"。

4. "模型即产品"的战略判断与基模公司的 Agent 军备竞赛

第二来源的核心论断"只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同",已经不再是一个理论推断,而是有实际产品迭代作为支撑的实证结论。

Kimi Work 的 Beta 版一周内完成开发、约 5 万行代码、92% 以上由 Kimi Code 自主生成——这本身就是一个自指闭环:产品即工具,工具即产品。OpenAI 的模式同样印证了这一点:GPT-5.5 发布后 Codex 能力飞速提升,同源模型升级直接带动 harness 能力跃升。 这不是巧合——当模型和 harness 来自同一技术栈,联合优化的摩擦成本趋近于零,而外部集成商每次模型升级都需要重新适配。

DeepSeek 开始招人做自己的 Agent,是这个规律的反向证据:连最强调"开源"和"API 调用"的模型公司都意识到,不自己做 harness,自家模型的能力就无法在 Agent 场景里充分释放。2026 H2 开始,国内基模公司的竞争主战场从"模型能力跑分"转向"真实知识工作场景的持续交付能力",谁能持续运转 + 持续交付结果,谁就把"模型即产品"变成了真实的竞争壁垒。

实践启示

1. 优先在"高重复、低创意"知识工作上部署本地 Agent

Vibe Working 最早的受益场景,不是需要深度判断的战略分析,而是高重复性、有明确输出标准、但人工执行耗时的知识工作。典型场景包括:同类竞品信息汇总、行业数据库结构化整理、定期财报数据提取与比对、标准格式报告批量生成。

这类场景的核心特征是:输入素材结构化程度高、输出格式相对固定、工作流程可拆解为并行子任务。Kimi Work 的 Agent 集群在 1224 个项目商机挖掘和 126 家 A 股低空经济分析中的实测已经验证了这类场景的可行性。 对于组织来说,这意味着第一批 AI 替代的人力成本将首先出现在知识工作领域,而非制造或服务领域。

2. 构建"开箱即用"数据管道是本地 Agent 落地的关键基础设施

Kimi Work 内置同花顺、天眼查、Yahoo Finance、arXiv 等专业数据源,其战略意义不只是"减少配置摩擦",而是重新定义了专业 AI Agent 的能力基线:能直接调用专业数据源 = 能交付达到专业标准的工作成果;只能联网搜索 = 只能交付参考级别的摘要。

对于行业从业者来说,这意味着本地 Agent 落地的关键投入不是模型选型,而是数据管道建设:组织内部有哪些专业数据库、SaaS 接口、数据供应商,需要先完成与 Agent 运行环境的对接,才能让 AI 真正产出达到工作标准的结果。一个配备了专业数据管道的 Kimi Work,远比一个只有模型能力但缺乏数据接入的云端 Agent 更有实用价值。

3. 评估组织是否准备好从"管一个人"转向"管一个团队"

Agent 集群的并行工作模式,对组织管理方式提出了新的要求。传统管理模式的核心假设是一个人执行一个任务、一个人汇报给一个上级;当 Agent 集群可以同时执行数十个并行任务时,管理者需要面对的问题不再是"如何分配任务给一个人",而是"如何定义任务边界让 AI 自行组织分工"。

组织在引入 Agent 集群之前,需要评估:管理者是否具备将复杂工作流拆解为清晰任务边界的能力?组织是否有"任务定义"的文化积累(即是否能清楚描述"我要什么"而非"怎么做")?如果答案是肯定的,Agent 集群可以成倍放大团队产能;如果答案是否定的,Agent 集群可能制造更多混乱而非效率。

4. 将"一天 N 版"迭代节奏纳入 AI 产品引进评估框架

Kimi Work 的 Beta 版发布策略——"一天 N 版迭代"、"不追求完美才发布"——代表了一种新的 AI 产品节奏。这个节奏与传统的"打磨成熟再发布"软件工程范式完全不同。 它背后的逻辑是:在 AI Agent 领域,方向正确比功能完整更重要;Beta 版的用户反馈比内部测试更能指引迭代方向。

对于引进 AI 产品的企业来说,这意味着评估框架需要调整:不再以"产品是否成熟"作为引进标准,而是以"产品的迭代速度和技术方向是否与业务需求匹配"作为标准。同时,企业需要建立与"一天 N 版"节奏匹配的使用者反馈机制——Beta 版的价值来自用户实际使用中的问题发现,而非演示环境中的功能展示。

5. 把"云端 vs 本地"视为架构层战略选择,而非部署便利性差异

云端 Agent 与本地 Agent 的选择,不是"哪个更方便"的体验问题,而是数据主权、工作环境嵌入深度、长期 AI 战略的综合架构决策。云端方案适合"AI 即插即用"的轻量场景,适合对数据安全边界要求明确但不希望管理本地基础设施的组织;本地方案适合"AI 需要深度嵌入日常工作流"的战略场景,适合数据资产丰富、工作流程复杂且需要 AI 持续运行的行业。

对于已经有云端 AI 工具引入计划的企业来说,正确的问题不是"云端好还是本地好",而是"这个工作流需要 AI 在我的工作环境里有多深地嵌入"。深度嵌入的工作流(如需要访问用户账号、本地文件、历史数据的工作),应该优先考虑本地方案;浅层接入的工作流(如提供参考建议、生成初稿的工作),云端方案足以应对。这个决策框架可以避免将"云端 vs 本地"变成一个意识形态之争,而是回到具体工作流的实际需求上做架构选择。

3rd 来源(2026-06-05):AGI Hunt / 尹 John 视角 — 300 Agent 集群实战

"2026 年的 AI,已经忽略程序员了。"

作者:尹John(前网易资深技术专家;AI 初创公司 CTO;AGI Hunt 主理人)

3 源独家价值(前 2 source 完全没出现的)

1. 独家数据:商机挖掘 1224 个项目漏斗

阶段 数量 细节
最终交付 1224 个项目 vs 单 Agent 偷懒(~20 个就放弃)
分组 97 组机会 自动任务拆解 + 预期管理
并行子 Agent 122 个 每个看 10 个项目
精选输出 50 个 程序员惯性要 .md 文件

独家金句:「卧槽,用户彻底怒了。」(单 Agent 偷懒被骂 vs Kimi Work 满交付的反差)

vs 机器之心版 (1st source):机器之心版讲"新能源汽车融资调研 4 个子 Agent"(小规模),本版讲"商机挖掘 122 个子 Agent"(大规模集群)。独家证明 300 Agent 集群在大规模任务上的可行性

2. 独家实战:PPT 制作 8 页 + "Executive Warmth" 主题

  • 配色方案:"Executive Warmth" 主题(灵感来自 Ralph Lauren + Cartier
  • 漏斗可视化:985 原始机会 → 291 初筛入围 → 50 最终精选(一页呈现)
  • 12 大主题领域 + 关键指标 + 核心发现
  • 售后自动化:自动保存到本机 + 自动打开

独家金句:「我主要做的事情是开头的几个字、后面的喝咖啡、以及最后索性去吃了个饭……」(Vibe Working 极致体现)

3. 独家比喻:可燃型员工 vs 自燃型团队

形态 行为 比喻
传统 Agent 一问一答 可燃型员工(踢一脚动一下)
Agent 集群 一声令下并行 自燃型团队(一大群 AI 同时干活)

独家金句:「如果 Vibe Coding 是用自然语言指挥 AI 写代码,那 Vibe Working 就是:你说了句话,一整个办公室的人(AI)开始同时动起来了。」

4. 独家对比:WebBridge vs 传统爬虫

方案 行为 风险
传统爬虫 程序化抓取 账号几天被封
WebBridge 模拟真人操作浏览器 安全(但禁止压力测试)

独家数据源对比: - Claude Code Computer Use / Codex 桌面操作:通用(无专业数据源) - Kimi Work 独家内置同花顺 + 天眼查 + Yahoo Finance + arXiv(金融投研 + 学术检索)

5. 独家自指证据:90% 代码 Kimi Code 自生成

"Kimi Work 本身由 Kimi Code 辅助写出,其中 90% 以上的代码由 Kimi Code 自主生成。"

自指闭环:Agent 产品(Kimi Work)由它自己的 Agent 工具(Kimi Code)写出来 — 模型公司 + Coding Agent 协同的极致证明

6. 独家数据:0.3% 全球付费 AI 用户

"地球上 81 亿人中付费使用 AI 的只有 0.3%。"

战略意义: - 99.7% 的人群尚未接触付费 AI - 知识工作者是 0.3% 内部的最大增长群体 - 解释了为什么 Coding Agent 厂商全部转向通用 Agent(Vibe Working)

7. 独家新场景:126 家 A 股低空经济公司炒股分析

  • 5 个专业 Agent 并行:财务分析官 + 合规审计官 + 总编辑 + 业务关联官 + 证据核验官
  • 工具:同花顺 Skill(读财务数据)+ 天眼查(穿透子公司和工商信息)
  • 输出:概念真实性评分表 + 证据包 + 复核优先级清单 + PDF 主题审计报告

vs 1st source 英伟达股价分析(11 页报告):本版 5 个专业 Agent 角色化分工 + 评分表 + 证据包,更接近真实投研工作流

3 源整合后的实体价值

3 译本视角对照

来源 公众号 独家价值
1st 机器之心(Qyd8mHuR5) Codex 500 万 / 知识工作者增速 3x / Harness 搬到本地 / 5 大技术特性 / 5 大实测场景
2nd 9号(ckzsd8QWz) "通用 Agent 一定来自模型公司"战略判断 / 自家模型 vs 套壳 API 优劣 / 国内基模公司竞争格局
3rd AGI Hunt / 尹 John 300 Agent 集群 1224 项目大数据 + PPT Executive Warmth 主题 + 可燃员工 vs 自燃团队比喻 + WebBridge vs 爬虫 + 0.3% 全球数据 + 90% 自生成自指

关键金句整合(3 源)

1st source: - "Vibe Coding 之后,下一个词是 Vibe Working" - "AI 长任务的真正挑战不再是上下文窗口有多长,而是 Harness 搭建得好不好"

2nd source: - "能并行的,就不要串行" - "Kimi Work 是用 Kimi Code 写的" - "真正的模型即产品,不止取决于模型能力"

3rd source: - "2026 年的 AI,已经忽略程序员了" - "可燃型员工 vs 自燃型团队" - "我主要做的事情是开头的几个字、后面的喝咖啡" - "Vibe Working 就是一整个办公室的人(AI)开始同时动起来了" - "全球 0.3% 付费 AI 用户"

3 源相互验证的关键事实

  • Codex 500 万周活 + 桌面版 2 月上线后翻 6 倍:1st source 独家
  • Anthropic 2 月企业 Agent 计划 + 5 月金融 Agent:1st source 独家
  • K2.6 模型 + Kimi Code 衍生 Kimi Work:3 源一致
  • WebBridge 内置数据源(同花顺/天眼查/Yahoo/arXiv):1st + 3rd 一致
  • 300 Agent 集群上限:1st + 3rd 一致
  • 90% 代码 Kimi Code 自生成:3rd 独家自指证据
  • 基模公司做 Agent 的天然优势:2nd + 3rd 一致

整合后 3 源的核心洞察

3 源覆盖的三大层次: 1. 产品层(1st):Kimi Work 是什么 + 5 大技术特性 + 5 大实测场景 2. 战略层(2nd):为什么是基模公司做 + 国内格局 + 真实工作场景竞争 3. 文化层(3rd):Vibe Working 范式转变 + 300 Agent 集群大数实战 + 可燃员工 vs 自燃团队 + 90% 自生成自指

3 源整合的 v×c 总价值 ≈ 9×9 + 1×8 + 1×8 ≈ 95-100(9=product layer, 1=culture layer, 1=strategy layer)