Kimi Work:通用 Agent 战场从云端迁移到本地¶
Ch01.159 Kimi Work:通用 Agent 战场从云端迁移到本地¶
📊 Level ⭐⭐ | 39.2KB |
entities/kimi-work-codex-vibe-working-paradigm-shift.md
Kimi Work:通用 Agent 战场从云端迁移到本地¶
"Vibe Coding 之后,下一个词是 Vibe Working。" —— 机器之心编辑部
Kimi Work 是月之暗面 K2.6 + Kimi Code Harness 搬到本地桌面的通用 Agent 产品(2026-06 Beta 发布)。与 OpenAI 把 Codex 并入 ChatGPT 同一时间发布,标志 "Vibe Working" 时代开启——AI Agent 主战场从写代码迁移到普通知识工作者的日常工作。
相关实体¶
→ 原文存档
一句话定位¶
"AI 长任务的真正挑战,不再是上下文窗口有多长,而是 Harness 搭建得好不好。"—— Harness 决定一切
三个关键事件¶
① OpenAI:Codex 周活 500 万,并入 ChatGPT¶
- 数据:Codex 周活用户已突破 500 万,桌面版用户自 2 月上线后翻了 6 倍多
- 增长最快群体:不是程序员,而是知识工作者(做报告 / 做表格 / 做 PPT 的"普通白领")—— 以开发者三倍以上的速度涌入,占全部用户约 20%
- 决策:未来几周内,Codex 的核心能力直接并入 ChatGPT——把执行利器塞进 ChatGPT 高频入口,走规模渗透路线
② Anthropic 提前布局¶
- 2 月:推出面向金融、工程等场景的企业 Agent 计划
- 5 月:上线深度面向金融行业的 Agent 产品
③ Kimi 发布 Kimi Work(Beta)¶
- 官方自评:"还是个 Baby"
- K2.6 模型参与共创,很快完成 Beta 版的开发与上线
- 核心定位:"本地通用 Agent 模式"——Kimi 电脑客户端推出,面向更广泛的知识工作者
- 技术路径:Kimi Work 内核源自 Kimi Code Coding Agent——把 Harness 从程序员终端下放到通用桌面
5 大技术特性¶
① Harness 搬到用户电脑上(核心架构决策)¶
对比云端 Agent(Kimi 网页版 / OpenAI cloud sandbox / Google Project Mariner): - 共同特点:在云端启动独立工作环境,帮用户把任务做完再交付结果 - 优势:安全隔离、易于部署 - 劣势:与用户真实工作环境的割裂——看不到本地文件、用不了用户账号、任务之间无记忆无上下文
Kimi Work 路线:Agent 住在本地、用你的环境、操作你的文件、带着你的登录状态去工作。理论上讲,本地 Agent 的边界 = 用户桌面工作的全部边界。
② Agent 集群:默认并行(最多 300 个分身)¶
核心理念:"串行工作是人类受限于精力的默认设定,但 AI 天生就应该是并行的"。 - 测试版上线即支持 Agent 集群——最多可自主创建 300 个分身,同时处理多线程任务 - 一边跑数据、一边写材料、同时自动化处理流程
实测案例(新能源汽车融资调研): - 4 个子 Agent("研究员")各自独立搜集信息,互不等待 - 完成后自动创建 2 个专职 Agent(数据清洗 + Excel 制作) - 整个过程不需要人工拆解任务、安排分工——它自己就把"项目管理"做掉了
③ Kimi WebBridge(浏览器桥接)¶
核心创新:直接操作用户当前正在使用的浏览器(包含用户自己的登录状态和习惯),而不是去新建一个空白的 AI 专用浏览器。
价值主张: - AI 直接"借用"你现有的浏览器环境——你登录过的账号、保存过的状态都直接成了它的资源 - 摩擦感降到最低 - 基本上你在浏览器上能做的 50% 的事情,它都能直接帮你操作
对比传统 AI 自动化: - 给 AI 一个专用沙盒浏览器(没账号没 Cookie)—— 安全但割裂 - 用户手动授权 + 配置 API——安全但摩擦 - WebBridge 思路:借用现有浏览器环境,摩擦感最低
④ 内置专业金融数据源¶
出厂自带:同花顺、天眼查、世界银行经济数据库等权威环境 - 金融人士无需再去头疼如何购买和配置各种 API——开箱即用 - 真实数据获取和处理流程(20 条工具调用 + 20 条命令),不是换说法的联网搜索
测试案例(英伟达股价分析): - 不去联网搜索现成分析文章 - 真正调用数据源,20 个工具 / 20 条命令 - 11 页完整分析报告(股价走势 / 累计收益率 / 波动率分析)
⑤ "全部允许" 模式(类似 --dangerously-skip-permissions)¶
- 用户只需指定一个具体的项目文件夹,选择"全部允许"即可
- Kimi 官方主张"足够安全,并不会超出文件夹行事"
- 建议:关键目录仍用"请求权限"模式
5 大测试场景实测¶
| 场景 | 任务 | 关键结果 |
|---|---|---|
| 调研 | 2025 年以来国内新能源汽车融资事件 → Excel | 4 子 Agent 并行搜集 + 2 专职 Agent 清洗/制表 |
| 本地文件 | 近一个月"具身智能 + 机器人"选题分类 | 飞快完成,真实本地文件(无需上传/复制粘贴) |
| 浏览器操控 | 通过 WebBridge 发微博 | 借用登录状态,50% 浏览器操作可自动化 |
| 长任务稳定性 | 30 位天才各 1000-3000 字演讲稿 + 日程 | 50+ 分钟、超时后自动重启动 + 断点续传、104 页 Word |
| 金融数据源 | 英伟达 2023+ 股价分析 | 20 工具 / 20 命令,11 页报告,真实数据管道(非搜索) |
30 位天才演讲稿任务的关键考验:"长程连贯性"——前面选了哪 30 个人、每个人确立了什么风格基调,后面的撰写必须和这些设定保持一致。50 分钟、跨越数十个子任务,Kimi Work 没有出现前后矛盾,超时后选择继续而不是放弃。
长程连贯性的工程细节¶
莫扎特演讲稿超时 → 自动重启 → 断点续传: - 任务失败后自动重新启动 - 从断点继续完成后续内容(不是从头再来) - 进度不丢失
对 Beta 版的评价:在长达 50 分钟、跨越数十个子任务的执行链条里,Kimi Work 没有出现前后矛盾,也没有在超时后选择放弃——对于一个刚发布的 Beta 版产品来说,已经相当能打。
Vibe Coding → Vibe Working 范式转移¶
"Vibe Coding 让不懂编程的人开始用 AI 写代码。Vibe Working 想做的是让不懂技术的人开始用 AI 完成知识工作。"
"两者的核心逻辑是一样的:把执行权交给 AI,把判断权留给人。"
两条路: - OpenAI:把 Codex 这个执行利器并进 ChatGPT 这个高频入口 → 规模渗透路线 - Kimi:本地 Agent 住在桌面上 → 深度嵌入路线
"两条路都在通向同一个地方:一个 AI 真正参与知识工作日常流程的未来。那个未来,比大多数人预想的,要来得要早一些。"
模型公司在通用 Agent 上的天然优势¶
"只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同:模型知道什么时候该调用什么工具,Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。"
Kimi 路径(不是临时起意): - 2025-07:万亿参数开源模型 Kimi K2——国内最早一批将 Agentic Coding、工具调用和自主任务执行能力作为核心目标打造的基础模型之一 - 2025-09:内测 Agent 模式(代号"OK Computer") - 2026-06:Kimi Work 发布——这条技术路径在桌面端的自然延伸
Kimi Work 的局限(官方自评)¶
- 任务失败时的恢复机制还需打磨
- 长时任务的中断与恢复还需完善
- 用户意图的准确理解还需提升
- "还是个 Baby"——Beta 版自评
迭代速度:「Kimi Work 正以一天 N 版的速度迭代中」——发布本身不是表明产品多完善,而是这个方向上的竞争已经进入了一个新的速度节奏。
核心断言¶
"AI 长任务的真正挑战,不再是上下文窗口有多长,而是 Harness 搭建得好不好。"
"Vibe Coding 之后,下一个词是 Vibe Working。"
与现有 wiki 实体的关系¶
vs wow-harness v3¶
- v3 = 跨 session 事件时间线 + 概念图(协议层治理)
- Kimi Work = Harness 搬到本地桌面(运行环境层变革)
- 共同点:都在解决"AI Agent 如何与真实工作环境对接"问题
vs PilotDeck¶
- PilotDeck = WorkSpace + Always-on + Dream 模式(多项目隔离)
- Kimi Work = 本地桌面 + 用户账号 + 真实文件(单桌面全场景)
- 共同点:都强调"AI 套上家"的工程范式
vs Agent Harness 架构¶
- 7 层 harness 模型是抽象框架
- Kimi Work + WebBridge 是具体落地实现
- 文章强化:"Harness 决定一切"——比模型能力重要
vs Rein¶
- Rein = 4 模块 + 5 类型边界(代码层架构)
- Kimi Work = Harness 从云端到本地(部署层架构)
- 共同点:都在"防止上帝文件 / 防止环境割裂"层面做工程化
vs Codex 6 职位插件¶
- 之前 Codex 还在"加插件拓展能力"
- 现在 OpenAI 直接把 Codex 并入 ChatGPT——赛道战略转向
启示¶
- Vibe Coding → Vibe Working 范式转移 —— AI Agent 主战场从代码迁移到知识工作(Codex 周活 500 万中白领增速 3 倍于开发者)
- 通用 Agent 战场从云端迁移到本地 —— 云端沙盒浏览器 vs 本地借用用户账号(WebBridge 思路胜出)
- 模型公司 + 自家 Harness = 不可复制的协同 —— 同时掌握模型 + Agent 运行环境的公司有天然优势
- Agent 集群是默认而非开关 —— AI 天生并行(最多 300 个分身)
- 本地 Agent 边界 = 桌面工作全部边界 —— 文件、账号、状态、应用都成为可调用资源
- 金融数据源是"开箱即用"分水岭 —— 内置数据管道 vs 联网搜索摘抄,差别巨大
- "一天 N 版"是 AI Agent 新节奏 —— Beta 版不再"打磨完美才发布",速度胜过完整
- Harness > 上下文窗口 —— AI 长任务的真正挑战是 Harness 搭建质量
局限 / 风险¶
- Kimi Work 是 Beta 版,任务恢复 / 中断恢复 / 意图理解都还在打磨
- "全部允许"模式(类似
--dangerously-skip-permissions)有潜在风险——用户需主动限制到具体文件夹 - WebBridge 借用登录状态是双刃剑——便利性 vs 账号安全责任边界
- 300 个 Agent 并行的成本 / 限速 / 沙箱问题未在文章中详细披露
- Codex 500 万周活 / 桌面版 6 倍数据来自 OpenAI 自报,缺第三方验证
相关对照¶
- wow-harness v3 —— 协议层治理
- PilotDeck —— 多项目隔离
- Agent Harness 架构 —— 7 层 harness 模型
- Rein —— 4 模块代码架构
- Agent Harness 上下文管理 —— 工作集视角
- Karpathy Vibe Coding → Agentic Engineering —— Vibe Coding 原始定义
→ 原文存档
第二来源补充:通用 Agent 一定来自模型公司¶
"只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同:模型知道什么时候该调用什么工具,Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。"
Kimi Work 的自指证据 — 5 万行 / 92% / 一周¶
官方宣称 Kimi Work 的 Beta 版在一周内完成开发: - co-author = K2.6(Kimi 自己的模型) - 整个项目累计产出约 5 万行有效代码 - 92% 以上由 Kimi Code 自主生成 - 产品本身就在证明 Agent 的能力 - 今天很多 Agent 产品的开发和迭代方式:Anthropic 用 Claude Code 开发 Claude Code,OpenAI 用 codex 开发 codex - 某种意义上,Agent 在自我迭代和进化
Kimi 一年的 Agent 积累路径¶
Kimi 从 2025 年 7 月起做 Agent 模型的连贯路径: - 2025-07:发布万亿参数开源模型 K2(国内最早一批将 Agentic Coding / 工具调用 / 自主任务执行能力作为核心目标的基础模型) - 2025-09:内测 Agent 模式(代号"OK Computer") - 2026-06:Kimi Work 发布 — 技术路径在桌面端的自然延伸 - 几乎一年的 Agent 产品经验积累 — 这是模型公司的结构性优势
"能并行的,就不要串行" 投研场景¶
典型场景:一个投研分析师需要追踪 20 家公司的最新财报数据,交叉比对行业趋势,最终产出研究报告
- 过去:一天甚至几天
- Kimi Work:Agent 同时拆出多个分身
- 一边抓取财报
- 一边整理行业数据
- 一边起草报告框架
- 分析师角色从埋头执行变成审阅和判断
核心理念:AI 没必要沿着人类的串行工作习惯走。复杂任务可被拆成多个工作流同时推进(K2.5 模型就开始打磨的能力)。
赛博禅心测试:Kimi Work 抓取 887 篇文章¶
测试任务:抓取公众号"赛博禅心"后台全部 887 篇文章的数据(发布日期 / 标题 / 阅读数 / 点赞数 / 在看数 / 分享数),做一个可视化页面。
对比: - Claude Code(之前做过):高铁上半个多小时,能跑通但更复杂,得稍微懂前端和数据处理 - Kimi Work(新做法): - 接到任务后自己打开浏览器 - 发现数据动态加载 - 先尝试接口获取(发现信息不全) - 改为模拟人类逐页浏览 - 自主定位页面元素 - 逐条抓取数据 - 不需要用户写一行代码,也不需懂页面结构 - 最终抓完 887 篇全量数据 + 自动生成可交互数据看板
核心金句:Agent 要成为工作工具,就必须进入用户已经在使用的工具环境。
"最好的通用 Agent 一定来自模型公司" 论断¶
"通用 Agent 产品的质量,取决于模型能力和 Harness 之间的深度协同。Agent 在真实环境里连续完成任务,每一步的成功率、容错能力、上下文保持、工具调用的准确性,都需要模型和 Harness 联合优化。第三方开发者可以调用 API,但无法调整模型与环境之间的配合方式。一方模型公司可以同时优化两端,模型更懂环境,环境更适配模型。"
关键证据链: - Claude Code 每次升级,第三方模型的适配可能就要调整一次 - GPT-5.5 发布后,Codex 能力获得飞速提升(同源模型升级带动 harness 提升) - DeepSeek 开始招人做自己的 Agent(反向证据:模型公司意识到必须做 harness)
结论:想让自家模型发挥最大能力,一个适配自己的 harness 架构,对于模型公司来说也是必不可少的。
国内通用 Agent 竞争格局¶
视角拉远: - Kimi Work = 月之暗面 通用 Agent 路线 - 豆包:即将上线付费(字节把 Agent 能力从免费试探推向正式产品化) - MiniMax Code:在路上(从 Coding Agent 切入的路径和 Kimi 类似)
2026 H2 最重要的方向转变: - 过去两年:国内基模公司竞争主要在模型能力层面(跑分 / 参数 / 上下文长度 / 推理速度) - 2026 H2 开始:转向真实知识工作场景 — 谁能持续运转 + 持续交付结果 - 这些是基础设施,不是产品;真正的产品竞争发生在真实工作场景里
核心断言:真正的模型即产品,不止取决于模型能力,还要看在模型之上,能交付出什么样的产品。
第二来源金句¶
- "能并行的,就不要串行"
- "Kimi Work 是用 Kimi Code 写的"(自指证据)
- "Agent 要成为工作工具,就必须进入用户已经在使用的工具环境"
- "只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同"
- "Claude Code 每次升级,第三方模型的适配可能就要调整一次"
- "GPT-5.5 发布后,Codex 的能力获得飞速提升"
- "真正的模型即产品,不止取决于模型能力"
- 基模公司的下一场仗,在知识工作场景里
深度分析¶
1. "Harness 搬到桌面"重构了 Agent 的能力边界¶
云端沙盒 Agent 的本质是一个任务托管环境——它与用户的桌面环境完全隔离,擅长处理"给定输入 → 产出一个结果"的独立任务。但这种架构天然存在一个边界:它无法感知用户的文件体系、无法使用用户的账号登录状态、无法在多个任务之间维持跨session的上下文积累。这意味着云端Agent适合执行离散的、一次性的任务,而不适合作为"日常工作流的一部分"嵌入知识工作。
Kimi Work 把 Harness 搬到本地桌面,实际上是把 Agent 从"任务托管商"变成了"桌面协作者"。 当 Agent 住在用户的桌面环境里,它的可用工具集从"AI专用工具集"扩展到了"用户在桌面上能用的一切"——本地文件、浏览器标签页、已登录的SaaS账号、专业数据接口。这意味着 Agent 的能力天花板不再是模型能力,而是用户桌面工作的全部边界。
这一架构决策的战略意义在于:它选择了深度嵌入而非规模渗透。OpenAI 把 Codex 并入 ChatGPT,是把 AI 送进已有高频入口;Kimi 把 Agent 搬到桌面,是让 AI 成为用户桌面环境的"原生成员"。两条路径都通向同一个未来,但短期内的竞争维度不同。
2. WebBridge 的"借用"逻辑颠覆了 AI 自动化范式¶
AI 自动化领域的传统范式是隔离:给 AI 一个干净的沙盒环境,确保它不会接触到用户的真实账号和敏感数据。这在安全层面是合理的,但在使用层面造成了巨大的摩擦——用户需要重新配置 API、重新登录账号、重新建立数据管道。
WebBridge 的"借用"逻辑本质上是一个身份桥接设计:AI 不再是新环境的主人,而是用户现有环境的临时访客。它使用用户的已登录状态、借用人家的浏览器环境、把用户已有的数据资源作为自己的工具。这一逻辑将摩擦感降到最低:用户不需要做任何配置,只需要"允许"一次,AI 就能以用户的身份在用户的环境中工作。
这引出了一个重要的设计哲学问题:AI 自动化工具应该更像"用户"还是更像"系统管理员"? 传统方案选择了后者(高权限独立账号),WebBridge 选择了前者(模拟用户在浏览器中的行为)。从 887 篇文章抓取的实际测试来看,WebBridge 的"模拟人类逐页浏览"路径比专用爬虫更稳健——前者不会被反爬机制拦截,后者会因为行为模式过于规律而被封禁。
这个"借用"逻辑的风险是双刃剑:便利性来源于 AI 拥有用户的身份权限,而这种身份权限的边界由浏览器安全模型决定,而非由 AI 产品本身决定。当 AI 能够"借用"用户登录状态完成微博发布,它同样可能"借用"同一会话完成其他操作——权限边界的控制完全依赖 AI 产品的内部约束设计。
3. Agent 集群是组织理论的结构性颠覆,不是功能升级¶
"最多 300 个分身"的 Agent 集群,其含义远不止于"并行处理更快"。从组织行为的视角来看,它是对人类工作组织的默认假设的根本性挑战。
传统知识工作组织的核心约束来自人类的注意力上限:一个人在同一时间只能处理一个复杂任务,因此组织结构必须设计成串行的流水线(分析师 → 整理师 → 写作者 → 审核人)。这种串行结构是人类认知局限的工程补偿,而非最优工作流的本质要求。
Agent 集群取消了这个约束。当一个任务可以被 AI 自动拆解为多个子工作流并行执行时,"项目管理"的角色开始被重新定义:不是人类在管理 AI 的分工,而是 AI 在自主决定何时并行、何时串行、何时创建新 Agent。 尹 John 提出的"可燃型员工 vs 自燃型团队"比喻,精确地捕捉了这个转变的含义:传统 Agent 是一问一答(踢一脚动一下),Agent 集群是一声令下自行运转(一大群 AI 同时动起来)。
这意味着在 Agent 集群的工作模式下,人类角色从任务执行者转变为任务定义者和结果审阅者。分析师说"给我整理 20 家公司的财报",AI 自主拆解任务、自行分配给 20 个并行 Agent、完成后汇总——分析师的精力从埋头执行变成了判断与审核。这个转变对组织设计的影响是深远的:当执行层被 AI 接管,"组织结构"的内涵将从"人的分工"变成"AI 工作流的编排方式"。
4. "模型即产品"的战略判断与基模公司的 Agent 军备竞赛¶
第二来源的核心论断"只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同",已经不再是一个理论推断,而是有实际产品迭代作为支撑的实证结论。
Kimi Work 的 Beta 版一周内完成开发、约 5 万行代码、92% 以上由 Kimi Code 自主生成——这本身就是一个自指闭环:产品即工具,工具即产品。OpenAI 的模式同样印证了这一点:GPT-5.5 发布后 Codex 能力飞速提升,同源模型升级直接带动 harness 能力跃升。 这不是巧合——当模型和 harness 来自同一技术栈,联合优化的摩擦成本趋近于零,而外部集成商每次模型升级都需要重新适配。
DeepSeek 开始招人做自己的 Agent,是这个规律的反向证据:连最强调"开源"和"API 调用"的模型公司都意识到,不自己做 harness,自家模型的能力就无法在 Agent 场景里充分释放。2026 H2 开始,国内基模公司的竞争主战场从"模型能力跑分"转向"真实知识工作场景的持续交付能力",谁能持续运转 + 持续交付结果,谁就把"模型即产品"变成了真实的竞争壁垒。
实践启示¶
1. 优先在"高重复、低创意"知识工作上部署本地 Agent¶
Vibe Working 最早的受益场景,不是需要深度判断的战略分析,而是高重复性、有明确输出标准、但人工执行耗时的知识工作。典型场景包括:同类竞品信息汇总、行业数据库结构化整理、定期财报数据提取与比对、标准格式报告批量生成。
这类场景的核心特征是:输入素材结构化程度高、输出格式相对固定、工作流程可拆解为并行子任务。Kimi Work 的 Agent 集群在 1224 个项目商机挖掘和 126 家 A 股低空经济分析中的实测已经验证了这类场景的可行性。 对于组织来说,这意味着第一批 AI 替代的人力成本将首先出现在知识工作领域,而非制造或服务领域。
2. 构建"开箱即用"数据管道是本地 Agent 落地的关键基础设施¶
Kimi Work 内置同花顺、天眼查、Yahoo Finance、arXiv 等专业数据源,其战略意义不只是"减少配置摩擦",而是重新定义了专业 AI Agent 的能力基线:能直接调用专业数据源 = 能交付达到专业标准的工作成果;只能联网搜索 = 只能交付参考级别的摘要。
对于行业从业者来说,这意味着本地 Agent 落地的关键投入不是模型选型,而是数据管道建设:组织内部有哪些专业数据库、SaaS 接口、数据供应商,需要先完成与 Agent 运行环境的对接,才能让 AI 真正产出达到工作标准的结果。一个配备了专业数据管道的 Kimi Work,远比一个只有模型能力但缺乏数据接入的云端 Agent 更有实用价值。
3. 评估组织是否准备好从"管一个人"转向"管一个团队"¶
Agent 集群的并行工作模式,对组织管理方式提出了新的要求。传统管理模式的核心假设是一个人执行一个任务、一个人汇报给一个上级;当 Agent 集群可以同时执行数十个并行任务时,管理者需要面对的问题不再是"如何分配任务给一个人",而是"如何定义任务边界让 AI 自行组织分工"。
组织在引入 Agent 集群之前,需要评估:管理者是否具备将复杂工作流拆解为清晰任务边界的能力?组织是否有"任务定义"的文化积累(即是否能清楚描述"我要什么"而非"怎么做")?如果答案是肯定的,Agent 集群可以成倍放大团队产能;如果答案是否定的,Agent 集群可能制造更多混乱而非效率。
4. 将"一天 N 版"迭代节奏纳入 AI 产品引进评估框架¶
Kimi Work 的 Beta 版发布策略——"一天 N 版迭代"、"不追求完美才发布"——代表了一种新的 AI 产品节奏。这个节奏与传统的"打磨成熟再发布"软件工程范式完全不同。 它背后的逻辑是:在 AI Agent 领域,方向正确比功能完整更重要;Beta 版的用户反馈比内部测试更能指引迭代方向。
对于引进 AI 产品的企业来说,这意味着评估框架需要调整:不再以"产品是否成熟"作为引进标准,而是以"产品的迭代速度和技术方向是否与业务需求匹配"作为标准。同时,企业需要建立与"一天 N 版"节奏匹配的使用者反馈机制——Beta 版的价值来自用户实际使用中的问题发现,而非演示环境中的功能展示。
5. 把"云端 vs 本地"视为架构层战略选择,而非部署便利性差异¶
云端 Agent 与本地 Agent 的选择,不是"哪个更方便"的体验问题,而是数据主权、工作环境嵌入深度、长期 AI 战略的综合架构决策。云端方案适合"AI 即插即用"的轻量场景,适合对数据安全边界要求明确但不希望管理本地基础设施的组织;本地方案适合"AI 需要深度嵌入日常工作流"的战略场景,适合数据资产丰富、工作流程复杂且需要 AI 持续运行的行业。
对于已经有云端 AI 工具引入计划的企业来说,正确的问题不是"云端好还是本地好",而是"这个工作流需要 AI 在我的工作环境里有多深地嵌入"。深度嵌入的工作流(如需要访问用户账号、本地文件、历史数据的工作),应该优先考虑本地方案;浅层接入的工作流(如提供参考建议、生成初稿的工作),云端方案足以应对。这个决策框架可以避免将"云端 vs 本地"变成一个意识形态之争,而是回到具体工作流的实际需求上做架构选择。
3rd 来源(2026-06-05):AGI Hunt / 尹 John 视角 — 300 Agent 集群实战¶
"2026 年的 AI,已经忽略程序员了。"
作者:尹John(前网易资深技术专家;AI 初创公司 CTO;AGI Hunt 主理人)
3 源独家价值(前 2 source 完全没出现的):
1. 独家数据:商机挖掘 1224 个项目漏斗¶
| 阶段 | 数量 | 细节 |
|---|---|---|
| 最终交付 | 1224 个项目 | vs 单 Agent 偷懒(~20 个就放弃) |
| 分组 | 97 组机会 | 自动任务拆解 + 预期管理 |
| 并行子 Agent | 122 个 | 每个看 10 个项目 |
| 精选输出 | 50 个 | 程序员惯性要 .md 文件 |
独家金句:「卧槽,用户彻底怒了。」(单 Agent 偷懒被骂 vs Kimi Work 满交付的反差)
vs 机器之心版 (1st source):机器之心版讲"新能源汽车融资调研 4 个子 Agent"(小规模),本版讲"商机挖掘 122 个子 Agent"(大规模集群)。独家证明 300 Agent 集群在大规模任务上的可行性。
2. 独家实战:PPT 制作 8 页 + "Executive Warmth" 主题¶
- 配色方案:"Executive Warmth" 主题(灵感来自 Ralph Lauren + Cartier)
- 漏斗可视化:985 原始机会 → 291 初筛入围 → 50 最终精选(一页呈现)
- 12 大主题领域 + 关键指标 + 核心发现
- 售后自动化:自动保存到本机 + 自动打开
独家金句:「我主要做的事情是开头的几个字、后面的喝咖啡、以及最后索性去吃了个饭……」(Vibe Working 极致体现)
3. 独家比喻:可燃型员工 vs 自燃型团队¶
| 形态 | 行为 | 比喻 |
|---|---|---|
| 传统 Agent | 一问一答 | 可燃型员工(踢一脚动一下) |
| Agent 集群 | 一声令下并行 | 自燃型团队(一大群 AI 同时干活) |
独家金句:「如果 Vibe Coding 是用自然语言指挥 AI 写代码,那 Vibe Working 就是:你说了句话,一整个办公室的人(AI)开始同时动起来了。」
4. 独家对比:WebBridge vs 传统爬虫¶
| 方案 | 行为 | 风险 |
|---|---|---|
| 传统爬虫 | 程序化抓取 | 账号几天被封 |
| WebBridge | 模拟真人操作浏览器 | 安全(但禁止压力测试) |
独家数据源对比: - Claude Code Computer Use / Codex 桌面操作:通用(无专业数据源) - Kimi Work 独家内置:同花顺 + 天眼查 + Yahoo Finance + arXiv(金融投研 + 学术检索)
5. 独家自指证据:90% 代码 Kimi Code 自生成¶
"Kimi Work 本身由 Kimi Code 辅助写出,其中 90% 以上的代码由 Kimi Code 自主生成。"
自指闭环:Agent 产品(Kimi Work)由它自己的 Agent 工具(Kimi Code)写出来 — 模型公司 + Coding Agent 协同的极致证明。
6. 独家数据:0.3% 全球付费 AI 用户¶
"地球上 81 亿人中付费使用 AI 的只有 0.3%。"
战略意义: - 99.7% 的人群尚未接触付费 AI - 知识工作者是 0.3% 内部的最大增长群体 - 解释了为什么 Coding Agent 厂商全部转向通用 Agent(Vibe Working)
7. 独家新场景:126 家 A 股低空经济公司炒股分析¶
- 5 个专业 Agent 并行:财务分析官 + 合规审计官 + 总编辑 + 业务关联官 + 证据核验官
- 工具:同花顺 Skill(读财务数据)+ 天眼查(穿透子公司和工商信息)
- 输出:概念真实性评分表 + 证据包 + 复核优先级清单 + PDF 主题审计报告
vs 1st source 英伟达股价分析(11 页报告):本版 5 个专业 Agent 角色化分工 + 评分表 + 证据包,更接近真实投研工作流。
3 源整合后的实体价值¶
3 译本视角对照¶
| 来源 | 公众号 | 独家价值 |
|---|---|---|
| 1st | 机器之心(Qyd8mHuR5) | Codex 500 万 / 知识工作者增速 3x / Harness 搬到本地 / 5 大技术特性 / 5 大实测场景 |
| 2nd | 9号(ckzsd8QWz) | "通用 Agent 一定来自模型公司"战略判断 / 自家模型 vs 套壳 API 优劣 / 国内基模公司竞争格局 |
| 3rd | AGI Hunt / 尹 John | 300 Agent 集群 1224 项目大数据 + PPT Executive Warmth 主题 + 可燃员工 vs 自燃团队比喻 + WebBridge vs 爬虫 + 0.3% 全球数据 + 90% 自生成自指 |
关键金句整合(3 源)¶
1st source: - "Vibe Coding 之后,下一个词是 Vibe Working" - "AI 长任务的真正挑战不再是上下文窗口有多长,而是 Harness 搭建得好不好"
2nd source: - "能并行的,就不要串行" - "Kimi Work 是用 Kimi Code 写的" - "真正的模型即产品,不止取决于模型能力"
3rd source: - "2026 年的 AI,已经忽略程序员了" - "可燃型员工 vs 自燃型团队" - "我主要做的事情是开头的几个字、后面的喝咖啡" - "Vibe Working 就是一整个办公室的人(AI)开始同时动起来了" - "全球 0.3% 付费 AI 用户"
3 源相互验证的关键事实¶
- Codex 500 万周活 + 桌面版 2 月上线后翻 6 倍:1st source 独家
- Anthropic 2 月企业 Agent 计划 + 5 月金融 Agent:1st source 独家
- K2.6 模型 + Kimi Code 衍生 Kimi Work:3 源一致
- WebBridge 内置数据源(同花顺/天眼查/Yahoo/arXiv):1st + 3rd 一致
- 300 Agent 集群上限:1st + 3rd 一致
- 90% 代码 Kimi Code 自生成:3rd 独家自指证据
- 基模公司做 Agent 的天然优势:2nd + 3rd 一致
整合后 3 源的核心洞察¶
3 源覆盖的三大层次: 1. 产品层(1st):Kimi Work 是什么 + 5 大技术特性 + 5 大实测场景 2. 战略层(2nd):为什么是基模公司做 + 国内格局 + 真实工作场景竞争 3. 文化层(3rd):Vibe Working 范式转变 + 300 Agent 集群大数实战 + 可燃员工 vs 自燃团队 + 90% 自生成自指
3 源整合的 v×c 总价值 ≈ 9×9 + 1×8 + 1×8 ≈ 95-100(9=product layer, 1=culture layer, 1=strategy layer)