快手首个打工人Agent¶
Ch01.009 快手首个打工人Agent¶
📊 Level ⭐ | 13.5KB |
entities/kuaishou-worker-agent-desktop-software.md
快手首个打工人Agent¶
-> 原文存档
摘要¶
快手上线的 KroWork 是一款面向普通职场人的桌面 Agent 工具——用户通过自然语言描述需求,KroWork 帮你把活儿干完,并把整个流程固化为一个可以直接打开的本地桌面应用。 与通用 Agent 产品相比,KroWork 的核心创新在于"应用固化 + 本地托管"——第一次生成消耗 token,之后每次打开都是零成本的本地执行。这一产品形态同时回应了 Agent 落地的四个老问题:提示词疲劳、成功率赌博、省 token、数据不出域。
核心要点¶
- "跑通一次,变成应用":用户跟 KroWork 说一遍需求,它帮你把活儿干完,然后直接把整个流程变成一个有界面、可反复使用的本地软件。第一次生成调用大模型,之后应用住在用户电脑里,打开如同普通软件,完全不用消耗 token。
- 典型案例:股票智能分析台:输入股票代码、时间范围,自动展示价格趋势并生成普通人能看懂的报告;几分钟内生成完整深色科技风桌面应用,支持设置价格波动提醒弹窗。
- 典型案例:AI 热点追踪器:自动抓取 X、Hacker News、Google News 上过去 24 小时讨论最多的 AI 话题,提取前 10 条并按热度排序。KroWork 在执行前会主动规划——发现 X/Twitter API 需付费,主动建议改用 Google News RSS。
- 持续迭代能力:通过"继续改进"按钮,可用自然语言继续给应用加功能(如"加中文摘要"、"特定主题标红"、"导出 Markdown 周报")。KroWork 在修改前会读现有代码和数据结构,弹权限确认框等待用户授权。
- 应用分享:用户生成的应用可以一键发给同事,对方无需配置环境直接用——"一个人做出的东西真正变成可流通的'资产'"。
- 数据不出域:应用跑在本地,数据读取、处理、存储全部在用户自己的设备上完成,整个过程在安全沙箱里执行。
深度分析¶
1. 四个老问题的一次性解决¶
过去半年 Agent 从"会聊"进化到"会做"再到"会记",但有四个老问题始终没解决。KroWork 用"应用固化 + 本地托管"一次解决。
问题 1:提示词疲劳(Prompt Fatigue)¶
同一份周报,上周已经把数据来源、统计口径、输出格式讲过一遍。这周换个文件名,Agent 又像"刚入职的实习生"一样重新问路、重新规划、重新试错——用户想要一个助手,最后变成了"AI 主管",每天最大的工作量是管理 AI。
业内称这种额外负担为 Prompt Fatigue:"你以为你在用工具,其实工具在用你。"
KroWork 的解法:把成功的工作流固化成应用。打开应用就是打开工具,不是开始一场新的对话。
问题 2:成功率赌博¶
同一个 Prompt 跑两次,输出可能完全不一样。写文案时这叫"创意",但若 Agent 在处理财务数据或发邮件,一次失败的代价远大于手动做。
KroWork 的解法:把衡量标准从"成功率 95% 也好"换成"桌面 Agent 的胜负手只有一个——在你最高频的专属工作流上跑到 100%"。一旦工作流变成应用,确定性步骤由代码执行,跟传统软件一样稳定,不存在"这次跑对了下次跑错"的问题。
问题 3:省 token¶
重复性工作每跑一次就烧一次 token。一天三次,一个月九十次,费用线性增长。 但 token 费用只是表层——更大的浪费是每次都要让 AI 重新理解需求,重新走一遍已经走过的路,跑偏了还得重来。
KroWork 的解法:固化成应用后,代码部分本地运行零消耗,只有真正需要判断的环节才调用模型。
问题 4:数据不出域¶
市面大量 Agent 产品需要把文件上传到第三方服务器处理——对很多企业和个人来说,"数据出域"本身就是一道心理和合规门槛。你愿意把公司财务报表传到别人的云上吗?
KroWork 的解法:从一开始就绕开这个问题——应用跑在本地,数据读取、处理、存储全部在用户自己的设备上完成,整个过程在安全沙箱里执行。对敏感资料来说,最强的安全承诺就是一句话:文件根本不用离开你的电脑。
2. "应用固化"作为 Agent 落地的工程范式¶
KroWork 的核心范式创新是应用固化(Application Solidification)——把一次性 Agent 执行的工作流固化为持久化的本地应用。
与传统 Agent 工具的对比:
| 维度 | 传统 Agent | KroWork |
|---|---|---|
| 执行成本 | 每次都调用大模型 | 应用固化后本地零 token |
| 输出稳定性 | 同 Prompt 多次结果可能不同 | 确定性步骤由代码保证 |
| 数据流向 | 多数需上传第三方服务器 | 全程本地 |
| 用户学习成本 | 每次都要重新讲需求 | 一次固化,永久使用 |
| 共享方式 | 难以分发 | 一键分享给同事 |
这一范式与 Enterprise Software Moats in the Agent Era 中关于"Agent 时代企业软件护城河"的论述高度契合——本地化部署 + 数据主权 + 工作流沉淀构成了新一代企业 Agent 工具的核心竞争壁垒。
3. 主动规划:Agent 决策能力的关键升级¶
KroWork 在执行 AI 热点追踪器任务时,主动规划而非直接开干:
- 发现 X/Twitter 的 API 需要付费($100/月起)
- 主动建议改用 Google News RSS 替代
- 列出三个数据源的可用性说明
- 等用户回 "ok" 才开始构建
这一行为揭示了成熟 Agent 工具的关键能力: - 执行前的资源评估:检查依赖、成本、可用性 - 替代方案推荐:当首选方案不可行时主动给出备选 - 等待用户授权:而非自作主张降级
这与 Factory Mission 系统 中 Orchestrator 的"梳理模糊需求"角色形成跨厂商印证——成熟 Agent 工具的核心是从"被动响应"升级为"主动规划 + 授权执行"。
4. browser-use 能力:Agent 的最后一块拼图¶
KroWork 的 browser-use 能力是另一项关键能力——它可以像人一样操作浏览器,进详情页、打开 PDF、追到 GitHub,读完再返回列表继续下一篇。
典型应用场景:AI 论文追踪分析器——根据 LLM Agent、Multimodal、Reasoning 等关键词,自动访问 arXiv、OpenReview 或项目主页,逐层点击抓取标题、作者机构、核心方法、实验亮点、代码链接,最后生成可导出的论文选题表。
工程含义:browser-use 让 Agent 从"对话 + 工具调用"扩展为"真实物理世界操作"——这打破了浏览器作为信息孤岛的限制,让 Agent 能够访问那些没有 API 的深度信息源。
5. 应用分享:从个人工具到团队资产¶
KroWork 的下一步棋是应用分享——你生成的应用可以一键发给同事,对方无需配置环境直接用。
这一升级的产业含义:
- 个人工具 → 团队资产:一个人做出来的东西真正变成可流通的"资产"
- 市场同学固化出来的竞品监控器,整个小组都能复用
- 财务做的票据核查工具,其他部门也能直接拿去跑
这与 AutoResearch 多 Agent 软件开发 中的"代码资产化"方向一致——Agent 时代最重要的不是工具本身,而是工具带来的可复用资产。
6. 对"AI 替代人"的另一种回答¶
KroWork 的故事隐含对"AI 替代人"叙事的另一种回答:AI 不是替代人,而是放大人的能力。
程序员早就会把重复劳动写成脚本,给自己造一堆小工具。真正被困住的,是不会写代码但每天都在重复处理信息的人——运营要做周报,市场要盯竞品,行政要整理文件,财务要核对票据,教师要管理课程资料。他们不缺想法,也不缺流程经验。缺的是把流程变成工具的能力。KroWork 所做的,就是把"写脚本"翻译成了自然语言,把"部署应用"藏进了桌面端。
这一观点与 24h 打工人 中关于"AI 数字员工"的方向相互呼应——Agent 时代的核心价值是让"非程序员"也能拥有制造工具的能力。
实践启示¶
1. 企业 AI 落地应从场景切入¶
与其追求大而全的 AI 战略,不如从高频、低风险的具体场景开始试点: - 跨境电商:盯各平台热卖品趋势 → "爆品雷达" - 金融从业者:实时追踪市场舆情和政策信号 → "舆情监控台" - 市场人员:监控竞品动态、产品上新、价格变动 → "竞品追踪器"
共同特征是:需求是你自己的、工作流是你最熟悉的、只是以前没有能力把它变成工具。
2. 关注 ROI 可见性¶
KroWork Agent 的价值在于可量化的效率提升,企业部署前应明确评估指标: - 频次指标:该工作流每月发生多少次 - 单次时长指标:人工完成需要多少时间 - 固化收益:固化成本(一次性 token 消耗)与长期收益的比 - 风险评估:失败一次的代价 vs 节省的总时间
3. 用户体验优先¶
桌面集成的形态降低了使用门槛,这是企业级 AI 产品成功的关键因素: - 零配置:打开就用,不用搭建环境 - 零 token:固化后每次运行不烧钱 - 零学习:用自然语言继续改进,不用记命令 - 可分发:一键分享给同事,无障碍使用
4. 本土化适配¶
国内企业的 AI 落地需考虑中文环境、国产软件生态等特殊因素: - 中文 NLP 优化 - 国内数据源(微信、微博、知乎、小红书等)的整合 - 数据主权与合规要求(重要行业、本地化部署) - 用户使用习惯差异(移动端、桌面端、IM 集成)
5. Prompt Fatigue 是 Agent 时代的隐形税¶
任何 Agent 产品都应该警惕 Prompt Fatigue——用户每次使用都要重新教育 AI,这本质上把"AI 提升效率"的承诺倒转为"AI 增加负担"。正确的 Agent 产品设计应当让 AI 记住、沉淀、复用用户的工作流,而不是每次都从零开始。
6. "应用固化"作为 Agent 工程的稳定态¶
考虑引入"应用固化"思路到你的 Agent 产品设计中: - 沉淀用户工作流:识别高频、重复的工作模式 - 支持自然语言迭代:让用户用对话而非代码修改应用 - 本地化优先:把数据主权作为基础承诺 - 分享与协作:把个人工具升级为团队资产
7. browser-use 是 Agent 能力扩展的关键方向¶
browser-use 能力让 Agent 能够访问没有 API 的信息源,这是 Agent 落地的最后一块拼图。如果你的 Agent 产品尚未支持 browser-use,应当评估集成时机。
相关实体¶
- 24h 打工人
- Enterprise Software Moats in the Agent Era
- AutoResearch 多 Agent 软件开发
- Factory Mission Multi-Agent 系统
- AgentOps on Bedrock
- agivar 录屏教学桌面 agent:清华非十科技 大脑小脑双层架构 + jittor 推理引擎 + 2.3× 速度