Huashu-Design 2.0 — Agent Skill 反收敛三套逻辑¶
Ch04.100 Huashu-Design 2.0 — Agent Skill 反收敛三套逻辑¶
📊 Level ⭐⭐ | 15.7KB |
entities/huashu-design-2-0-flower-uncle-3-patterns.md
Huashu-Design 2.0 — Agent Skill 反收敛三套逻辑¶
核心: 花叔 (alchaincyf) 在 2 个月 16k+ star 之后, 把 Huashu-Design v1 推翻重写为 2.0. 关键问题不是模型能力, 而是 "AI 自动收敛到安全极简 (Anthropic 官网味儿)". 2.0 用 3 套并行逻辑 (撞/借/请) + 图片前置 + 事实验证第 0 原则, 系统性解决 3 个真实坑.
关键定位: Skill vs 软件¶
设计软件: 画布 / 图层 / 工具栏 — 预设你是动手的人. Skill: 预设你是做决策做判断的人.
这不只是顺手问题, 是"你在机器里扮演什么角色"的根本区别.
3 个真实坑 (工业级失败案例)¶
坑一 · 设计收敛成"安全极简"¶
v1 失败模式: 内置 20 种设计风格让 agent 随机挑, 想法是"多样性". 实际结果: 模糊需求面前, AI 自动躲进最熟、最不会出错的安全角落 — 10 个长得都差不多 (米白底 + 大量留白 + 点缀色, Anthropic 官网味儿).
2.0 解法: 撞/借/请 三套逻辑同时跑, 三套各走各的路, 专门跟"安全极简"对着干:
| 逻辑 | 策略 | 实现 | 目的 |
|---|---|---|---|
| 🎲 撞 | 靠运气 | 让 agent 随机抽 | 打破惯性 |
| 🏆 借 | 借获奖作品 | 搜真实世界拿过奖的同类网站, 借鉴迁移 | 真实世界最高标准锚定 |
| 🧠 请 | 请大师从头想 | "预算无上限, 请谁最合适" → agent 变那位大师脑子从头做 | 顶级设计哲学 |
真实案例 (马来西亚旅行网站): 一句话需求, 没给任何风格参考, 出来 3 版: - 暗色编辑部风: 热带大图在暖黑底上炸开 (作者自己绝不会主动选, 但惊艳到了) - 沉浸式大图风: 对标 Clio 铜奖 Visit Faroe Islands - 暖白杂志风: 像翻开 Condé Nast Traveler
核心洞见: AI 设计工具的价值不是"帮我更快做出本来想做的东西", 而是"给我一版我自己根本想不到、但一眼就服的方案". 当"做出来"越来越便宜, 剩下唯一难的就是"该选哪个".
坑二 · 内容网站没有真图 = 空壳¶
v1 失败: 让它做鹦鹉科普网站, 排版漂亮, 但没有一张鹦鹉的图, 全是灰色占位块.
金句: "鹦鹉网站没有鹦鹉图, 等于失败."
2.0 解法 — 图片前置: 1. 开工前先问: "图片是不是这个内容的必需品?" 2. 科普/旅游 → 图就是命根子 → 先把真图取齐, 再开始设计 3. 案例: 鹦鹉网站 → Wikimedia Commons (公共领域照片 + 古典博物版画) → 抓一整批真图, 再动手
分水岭: 这是"能看的 demo"和"能用的成品"之间的唯一分水岭.
坑三 · AI 一本正经地瞎编产品事实¶
v1 真实翻车案例: 让它给大疆 Pocket 4 做发布动画, 它说"Pocket 4 还没发布, 我们做个概念 demo 吧" — 结果 Pocket 4 几天前刚发布, 官方 Launch Film 全都有. 它基于错误事实做了一版废稿.
根因: AI 凭训练语料记忆对不确定的事做断言. "我记得好像还没发布" "应该是 v3 版本" — 听着自信, 全是猜的.
不是设计才有的毛病, 是所有 AI 应用的通病. 放在做设计物料上代价更直接: 事实错了, 画得再美都是废稿.
2.0 解法 — 第 0 原则: 「事实验证先于假设」 凌驾于所有流程之上.
- 涉及具体产品 / 版本号 / 规格 / 发布状态 → 第 1 步必须先搜一遍核实
- 把事实写进文件, 绝不靠记忆
- 搜不到就问用户, 不自己编
案例: 新加坡招商 PPT → 樟宜机场吞吐量 / QS 排名 / 税率, 每个都先核实出处再写. 搜一遍花 10 秒, 返工花两小时, 这账太好算了.
跨域可复用的 3 条原则¶
3 个 2.0 引入的原则, 对任何 agent skill 设计都适用:
原则 1: 撞/借/请 — 三套并行反收敛¶
当 AI 容易收敛到"最安全选项"时, 强制 3 套独立逻辑并行跑: - 随机逻辑 (撞) — 打破惯性 - 真实世界锚定 (借) — 用最高标准做标杆 - 顶级专家哲学 (请) — 按大师方法从头做
适用场景: 任何"AI 输出过于同质化"的问题 (文案 / 设计 / 方案 / 决策).
原则 2: 核心资产前置¶
内容型任务开工前, 先验证"核心资产是否齐备": - 内容网站 → 真图 (Wikimedia Commons / 公共数据集) - 编程项目 → 真实依赖 (PyPI / npm / 真实 API 端点) - 报告 / 论文 → 真实数据源 (官方数据库 / 验证过的引用)
分水岭: 没有核心资产 = 做得再花也是空壳.
原则 3: 事实验证第 0 原则¶
任何涉及具体事实的任务, 第 1 步必须搜索核实, 搜不到就问用户: - 凌驾于所有流程之上 - 涉及: 产品 / 版本 / 数据 / 规格 / 发布状态 - 绝不靠记忆, 绝不"我猜应该是"
Cost/benefit: 搜索 10 秒 vs 返工 2 小时.
项目元数据¶
| 字段 | 值 |
|---|---|
| 作者 | 花叔 (alchaincyf) |
| GitHub | https://github.com/alchaincyf/huashu-design |
| 安装 | npx skills add alchaincyf/huashu-design |
| Star | 2 个月 16k+ |
| 基础 | 逆向 Claude Design 设计思路 |
| 适用 Agent | Codex / OpenClaw / Hermes Agent / WorkBuddy / Trae / Kimi Work |
| 能力 | 网站 / App 原型 / PPT (HTML deck + 可编辑 pptx 导出) / 动画 / 信息图 / 长视频 |
| 不适合 | 生产级 Web App / 需要后端的动态系统 / SEO 网站 |
PPT 范式转变: HTML deck 优于 pptx¶
作者态度转变: 做完之后反而劝别再导成 pptx.
HTML deck 优势: - 概览墙 鸟瞰全局 → 点任意一页 → 全屏滑入 - 跟真正的 Keynote 一个手感 - 观感和流畅度已经比传统 pptx 好一截
仍然支持 pptx 导出 (公司要求时): - 拖进 PowerPoint, 双击标题光标就进去 - 文字是真文字, 图表是真形状 (不是截图假导出)
与 17哥 vs 比较¶
| 维度 | 17哥 vs 评测平台 | Huashu-Design 2.0 |
|---|---|---|
| 领域 | 通用 Harness / 6 Sub-Agent 协作 | AI 设计工具 (Skill) |
| 核心创新 | 6 Sub-Agent + Agent Handoff YAML 协议 | 撞/借/请 三套逻辑反安全极简 |
| 量化 | 1天→2小时 (4x speedup) | 16k+ star / 2 个月 |
| 验证 | Git Submodule 单仓重构 + E2E 自动化 | 真实案例 (马来西亚旅行 / 鹦鹉网站 / Pocket 4) |
| 跨域可复用 | Agent 协作模式 | 撞/借/请 / 资产前置 / 事实验证第 0 原则 |
| 可互补 | ✓ | ✓ (花叔的 3 原则可应用到 17哥 的 6 Sub-Agent prompt) |
相关实体¶
- Agent Skill 设计模式 — 撞/借/请 / 资产前置 / 第 0 原则 是 Skill 设计的通用模式
- Harness 模式 6-SubAgent 实战 — 17哥 vs 评测平台 — 互补 (决策者 vs 动手者)
→ 原文存档
深度分析¶
核心观点:Skill 的"反收敛"问题是 AI 能力提升后的普遍矛盾¶
Huashu-Design 2.0 的 3 个真实坑(设计收敛成安全极简、内容网站无真图、AI 一本正经瞎编事实)揭示了一个在 AI 能力大幅提升后才会暴露的系统性问题:当 AI"能做"之后,它反而倾向于做最安全、最保守的选择。这不是花叔工具独有的问题,而是所有高能力 AI 辅助工具面临的共同矛盾——AI 越强,越容易收敛到"最不容易出错"的解法,而非"最优"的解法。这与 Harness Engineering Paradigm Shift 中描述的"AI 能力提升后,harness 设计需要重新思考人机协作模式"问题一脉相承。
技术要点:3 套并行逻辑的设计原理¶
撞/借/请三套并行逻辑的本质是通过强制差异化来对抗 AI 的收敛倾向:
- 撞(随机):引入真正的随机性打破 AI 的惯性路径。AI 生成有内在偏好分布,随机采样可以强制探索低概率路径。
- 借(真实世界锚定):用"已证明成功的真实作品"作为约束条件,强制 AI 的输出锚定在已被人类验证的高标准上,而非 AI 自己的"安全直觉"。
- 请(专家心智模型):通过角色代入,让 AI 从"大师"的角度重新思考问题,这本质上是 prompt engineering 的一种形式,目的是借用专家的决策框架而非 AI 自己学到的统计平均。
三种方式共同解决了"AI 输出同质化"的根本问题:同质化是因为缺乏约束,而这三套逻辑引入了三种不同维度的约束。
实践价值:为什么"图片前置"和"事实验证第 0 原则"是可复用的设计原则¶
-
图片前置揭示了一个重要的任务规划原则:核心资产缺失时,后续所有工作都是无效的。在开始生成式任务前,先确认"完成这个任务所需的不可替代素材"是否存在。这个原则可以迁移到任何内容生成场景:代码生成前确认依赖是否可用,报告生成前确认数据源是否可访问。
-
事实验证第 0 原则解决的是 AI 在"自信地犯错"方面的深层问题。AI 的训练目标是最可能的输出,而非正确的输出,因此当训练语料中有不确定的信息时,AI 会以高置信度"猜测"一个看似合理的答案。第 0 原则的本质是将"事实不确定性"从 AI 的内部状态转移到外部的可验证流程。
与 Agent Skill 设计的深层关联¶
Huashu-Design 的 3 个坑和 3 个原则,本质上是在回答一个问题:当 AI 作为"做决策的人"而非"动手的人"时,如何保证决策质量? 这与 Skill Design Patterns 中讨论的 skill 设计维度高度相关——skill 的设计者需要预判 AI 在哪些地方会"偷懒"或"自信地犯错",并通过设计提前插入防护栏。
跨工具可复用性的本质¶
3 个原则(撞/借/请、核心资产前置、事实验证第 0 原则)之所以对任何 agent skill 都适用,是因为它们针对的不是具体任务类型,而是 AI 在处理不确定性时的系统性偏差:收敛偏好(撞/借/请解决)、资源完整性假设(资产前置解决)、事实不确定性转自信输出(事实验证第 0 原则解决)。这些偏差在任何 AI 系统中都存在,与具体场景无关。
实践启示¶
对 Agent Skill 设计者¶
-
预设 AI 会"偷懒"到最安全的解法:在设计 skill 时,主动考虑"AI 最可能收敛到哪个最保守的答案",然后设计机制强制对抗这种收敛。参考 Skill Design Patterns 中的"避免 AI 输出同质化"相关章节。
-
核心资产完整性检查应该是第 0 步:在任何内容生成类 skill 中,先检查"完成这个任务所需的不可替代素材是否齐全",再开始生成。这个检查点应该在 skill 流程的最前端,而非在生成过程中发现问题后才补救。
-
涉及具体事实的任务必须强制事实核查流程:当 skill 输出涉及产品名称、版本号、数据、发布时间等具体事实时,必须在流程中嵌入搜索验证步骤,而非依赖 AI 的训练记忆。这是避免"AI 一本正经地瞎编"的最有效手段。
-
多套并行逻辑的工程实现:撞/借/请 并行运行会增加 token 消耗和延迟,但在需要高质量输出的场景下是值得的。可以根据任务重要性动态调整并行度(重要任务三套全跑,一般任务只跑借/请)。
对 AI 辅助工具的用户¶
-
不要只问 AI"能帮我做什么",要问" AI 最可能帮我做成什么样":了解 AI 的收敛偏好,可以更有效地给出对抗性的约束条件,引导 AI 走出安全角落。
-
对 AI 生成的设计/文案/代码,主动寻找"我没有想到但眼前一亮"的版本:当 AI 生成的第一个版本看起来"差不多"时,这正是收敛的信号,需要用更激进的 prompt(如"给我一个我自己绝对想不到的方案")来对抗。
-
在专业领域使用 AI 时,始终保留"专家审核"环节:AI 可以快速给出多样化的选项,但最终选择需要人类专家判断。AI 的价值在于扩展选项空间,而非压缩决策责任。
对 AI 系统工程师(harness 设计者)¶
-
在 harness 层面支持多版本并行生成:参考 Huashu-Design 的三套并行逻辑,harness 可以设计"多版本并行生成 + 差异评估"的能力,而非串行生成然后挑最好的。
-
建立"任务前置检查"的标准模式:将"核心资产完整性检查"和"事实性约束验证"封装为可复用的 harness 子模块,供所有 skill 调用。
-
对 AI 的不确定性输出添加置信度信号:让 AI 在输出事实性内容时标注不确定性水平,而非以相同置信度输出所有内容。这可以帮助用户识别需要人工核查的部分。
相关实体: - Skill Design Patterns — skill 设计维度的通用模式 - Harness Engineering Practical 17Ge Versus 6 Subagent — 互补的 Harness 模式(决策者 vs 动手者) - 深入理解 Claude Code 源码中的 Agent Harness 构建之道 — Claude Code harness 架构参考 - Harness Engineering Paradigm Shift — AI 能力提升后的 harness 设计范式转移 - Agent Role Specialization — agent 在"做决策"和"动手"之间的角色分化