跳转至

快手首个打工人Agent

Ch01.009 快手首个打工人Agent

📊 Level ⭐ | 13.5KB | entities/kuaishou-worker-agent-desktop-software.md

快手首个打工人Agent

-> 原文存档

摘要

快手上线的 KroWork 是一款面向普通职场人的桌面 Agent 工具——用户通过自然语言描述需求,KroWork 帮你把活儿干完,并把整个流程固化为一个可以直接打开的本地桌面应用。 与通用 Agent 产品相比,KroWork 的核心创新在于"应用固化 + 本地托管"——第一次生成消耗 token,之后每次打开都是零成本的本地执行。这一产品形态同时回应了 Agent 落地的四个老问题:提示词疲劳、成功率赌博、省 token、数据不出域

核心要点

  • "跑通一次,变成应用":用户跟 KroWork 说一遍需求,它帮你把活儿干完,然后直接把整个流程变成一个有界面、可反复使用的本地软件。第一次生成调用大模型,之后应用住在用户电脑里,打开如同普通软件,完全不用消耗 token
  • 典型案例:股票智能分析台:输入股票代码、时间范围,自动展示价格趋势并生成普通人能看懂的报告;几分钟内生成完整深色科技风桌面应用,支持设置价格波动提醒弹窗。
  • 典型案例:AI 热点追踪器:自动抓取 X、Hacker News、Google News 上过去 24 小时讨论最多的 AI 话题,提取前 10 条并按热度排序。KroWork 在执行前会主动规划——发现 X/Twitter API 需付费,主动建议改用 Google News RSS。
  • 持续迭代能力:通过"继续改进"按钮,可用自然语言继续给应用加功能(如"加中文摘要"、"特定主题标红"、"导出 Markdown 周报")。KroWork 在修改前会读现有代码和数据结构,弹权限确认框等待用户授权。
  • 应用分享:用户生成的应用可以一键发给同事,对方无需配置环境直接用——"一个人做出的东西真正变成可流通的'资产'"。
  • 数据不出域:应用跑在本地,数据读取、处理、存储全部在用户自己的设备上完成,整个过程在安全沙箱里执行。

深度分析

1. 四个老问题的一次性解决

过去半年 Agent 从"会聊"进化到"会做"再到"会记",但有四个老问题始终没解决。KroWork 用"应用固化 + 本地托管"一次解决。

问题 1:提示词疲劳(Prompt Fatigue)

同一份周报,上周已经把数据来源、统计口径、输出格式讲过一遍。这周换个文件名,Agent 又像"刚入职的实习生"一样重新问路、重新规划、重新试错——用户想要一个助手,最后变成了"AI 主管",每天最大的工作量是管理 AI。

业内称这种额外负担为 Prompt Fatigue:"你以为你在用工具,其实工具在用你。"

KroWork 的解法:把成功的工作流固化成应用。打开应用就是打开工具,不是开始一场新的对话。

问题 2:成功率赌博

同一个 Prompt 跑两次,输出可能完全不一样。写文案时这叫"创意",但若 Agent 在处理财务数据或发邮件,一次失败的代价远大于手动做

KroWork 的解法:把衡量标准从"成功率 95% 也好"换成"桌面 Agent 的胜负手只有一个——在你最高频的专属工作流上跑到 100%"。一旦工作流变成应用,确定性步骤由代码执行,跟传统软件一样稳定,不存在"这次跑对了下次跑错"的问题

问题 3:省 token

重复性工作每跑一次就烧一次 token。一天三次,一个月九十次,费用线性增长。 但 token 费用只是表层——更大的浪费是每次都要让 AI 重新理解需求,重新走一遍已经走过的路,跑偏了还得重来。

KroWork 的解法:固化成应用后,代码部分本地运行零消耗,只有真正需要判断的环节才调用模型

问题 4:数据不出域

市面大量 Agent 产品需要把文件上传到第三方服务器处理——对很多企业和个人来说,"数据出域"本身就是一道心理和合规门槛。你愿意把公司财务报表传到别人的云上吗?

KroWork 的解法:从一开始就绕开这个问题——应用跑在本地,数据读取、处理、存储全部在用户自己的设备上完成,整个过程在安全沙箱里执行。对敏感资料来说,最强的安全承诺就是一句话:文件根本不用离开你的电脑。

2. "应用固化"作为 Agent 落地的工程范式

KroWork 的核心范式创新是应用固化(Application Solidification)——把一次性 Agent 执行的工作流固化为持久化的本地应用。

与传统 Agent 工具的对比

维度 传统 Agent KroWork
执行成本 每次都调用大模型 应用固化后本地零 token
输出稳定性 同 Prompt 多次结果可能不同 确定性步骤由代码保证
数据流向 多数需上传第三方服务器 全程本地
用户学习成本 每次都要重新讲需求 一次固化,永久使用
共享方式 难以分发 一键分享给同事

这一范式与 Enterprise Software Moats in the Agent Era 中关于"Agent 时代企业软件护城河"的论述高度契合——本地化部署 + 数据主权 + 工作流沉淀构成了新一代企业 Agent 工具的核心竞争壁垒。

3. 主动规划:Agent 决策能力的关键升级

KroWork 在执行 AI 热点追踪器任务时,主动规划而非直接开干:

  1. 发现 X/Twitter 的 API 需要付费($100/月起)
  2. 主动建议改用 Google News RSS 替代
  3. 列出三个数据源的可用性说明
  4. 等用户回 "ok" 才开始构建

这一行为揭示了成熟 Agent 工具的关键能力: - 执行前的资源评估:检查依赖、成本、可用性 - 替代方案推荐:当首选方案不可行时主动给出备选 - 等待用户授权:而非自作主张降级

这与 Factory Mission 系统 中 Orchestrator 的"梳理模糊需求"角色形成跨厂商印证——成熟 Agent 工具的核心是从"被动响应"升级为"主动规划 + 授权执行"。

4. browser-use 能力:Agent 的最后一块拼图

KroWork 的 browser-use 能力是另一项关键能力——它可以像人一样操作浏览器,进详情页、打开 PDF、追到 GitHub,读完再返回列表继续下一篇。

典型应用场景:AI 论文追踪分析器——根据 LLM Agent、Multimodal、Reasoning 等关键词,自动访问 arXiv、OpenReview 或项目主页,逐层点击抓取标题、作者机构、核心方法、实验亮点、代码链接,最后生成可导出的论文选题表。

工程含义:browser-use 让 Agent 从"对话 + 工具调用"扩展为"真实物理世界操作"——这打破了浏览器作为信息孤岛的限制,让 Agent 能够访问那些没有 API 的深度信息源。

5. 应用分享:从个人工具到团队资产

KroWork 的下一步棋是应用分享——你生成的应用可以一键发给同事,对方无需配置环境直接用。

这一升级的产业含义

  • 个人工具 → 团队资产:一个人做出来的东西真正变成可流通的"资产"
  • 市场同学固化出来的竞品监控器,整个小组都能复用
  • 财务做的票据核查工具,其他部门也能直接拿去跑

这与 AutoResearch 多 Agent 软件开发 中的"代码资产化"方向一致——Agent 时代最重要的不是工具本身,而是工具带来的可复用资产

6. 对"AI 替代人"的另一种回答

KroWork 的故事隐含对"AI 替代人"叙事的另一种回答:AI 不是替代人,而是放大人的能力

程序员早就会把重复劳动写成脚本,给自己造一堆小工具。真正被困住的,是不会写代码但每天都在重复处理信息的人——运营要做周报,市场要盯竞品,行政要整理文件,财务要核对票据,教师要管理课程资料。他们不缺想法,也不缺流程经验。缺的是把流程变成工具的能力。KroWork 所做的,就是把"写脚本"翻译成了自然语言,把"部署应用"藏进了桌面端。

这一观点与 24h 打工人 中关于"AI 数字员工"的方向相互呼应——Agent 时代的核心价值是让"非程序员"也能拥有制造工具的能力。

实践启示

1. 企业 AI 落地应从场景切入

与其追求大而全的 AI 战略,不如从高频、低风险的具体场景开始试点: - 跨境电商:盯各平台热卖品趋势 → "爆品雷达" - 金融从业者:实时追踪市场舆情和政策信号 → "舆情监控台" - 市场人员:监控竞品动态、产品上新、价格变动 → "竞品追踪器"

共同特征是:需求是你自己的、工作流是你最熟悉的、只是以前没有能力把它变成工具

2. 关注 ROI 可见性

KroWork Agent 的价值在于可量化的效率提升,企业部署前应明确评估指标: - 频次指标:该工作流每月发生多少次 - 单次时长指标:人工完成需要多少时间 - 固化收益:固化成本(一次性 token 消耗)与长期收益的比 - 风险评估:失败一次的代价 vs 节省的总时间

3. 用户体验优先

桌面集成的形态降低了使用门槛,这是企业级 AI 产品成功的关键因素: - 零配置:打开就用,不用搭建环境 - 零 token:固化后每次运行不烧钱 - 零学习:用自然语言继续改进,不用记命令 - 可分发:一键分享给同事,无障碍使用

4. 本土化适配

国内企业的 AI 落地需考虑中文环境、国产软件生态等特殊因素: - 中文 NLP 优化 - 国内数据源(微信、微博、知乎、小红书等)的整合 - 数据主权与合规要求(重要行业、本地化部署) - 用户使用习惯差异(移动端、桌面端、IM 集成)

5. Prompt Fatigue 是 Agent 时代的隐形税

任何 Agent 产品都应该警惕 Prompt Fatigue——用户每次使用都要重新教育 AI,这本质上把"AI 提升效率"的承诺倒转为"AI 增加负担"。正确的 Agent 产品设计应当让 AI 记住、沉淀、复用用户的工作流,而不是每次都从零开始。

6. "应用固化"作为 Agent 工程的稳定态

考虑引入"应用固化"思路到你的 Agent 产品设计中: - 沉淀用户工作流:识别高频、重复的工作模式 - 支持自然语言迭代:让用户用对话而非代码修改应用 - 本地化优先:把数据主权作为基础承诺 - 分享与协作:把个人工具升级为团队资产

7. browser-use 是 Agent 能力扩展的关键方向

browser-use 能力让 Agent 能够访问没有 API 的信息源,这是 Agent 落地的最后一块拼图。如果你的 Agent 产品尚未支持 browser-use,应当评估集成时机。

相关实体