从Vibe Coding到Agentic Engineering：重构后台开发全流程¶

Ch04.366 从Vibe Coding到Agentic Engineering：重构后台开发全流程¶

📊 Level ⭐⭐ | 6.8KB | entities/从vibe-coding到agentic-engineering重构后台开发全流程.md

从Vibe Coding到Agentic Engineering：重构后台开发全流程¶

深度分析¶

从"提示即祈祷"到"结构化执行"的范式转变。 Vibe Coding 本质上是将需求直接扔给 AI 对话框，靠自然语言驱动代码生成，其核心特征是"提示即祈祷"（prompt-and-pray）——开发者把需求描述交给 AI，然后祈祷输出质量可接受。这种方式在原型验证阶段确实爽，但一旦进入生产环境，代码质量不可控、审查流程缺失、commit message 混乱等问题接踵而至。Agentic Engineering 的出现代表了行业对这一问题的系统性反思：不是让 AI 自由发挥，而是把人定位为"编排者"（Orchestrator），AI 作为自主智能体在结构化流程中执行规划、编码、测试和迭代，每个关键节点都有人工审核。

三层工具体系的精妙分层。 文章揭示了一套分层工具架构：Skill（技能）承载核心业务逻辑，由系统根据上下文自动触发或被 Command 调用，每个 Skill 有独立的工具权限白名单和执行流程；Command（斜杠命令）是用户主动调用的薄入口，委托给对应 Skill 执行；MCP Server 则是通过 Model Context Protocol 连接外部平台 API，为 Skill 提供数据和操作能力。更值得注意的是 Superpowers 插件提供的结构化工作流 Skill（brainstorming、writing-plans、executing-plans），它们定义了从需求澄清到代码交付的标准流程，本质上是在 AI 执行层之上增加了一层"工程纪律"，防止 AI 跳过关键步骤自由发挥。

十一阶段流水线的工程化思维。 从需求创建到合入发布的全流程被拆解为 11 个阶段：需求获取与分支初始化 → 交互式需求澄清 → 制定实施计划 → 并行执行开发任务 → 代码自审 → 编译部署 → 日志排查 → 创建 MR → AI 辅助评审 → 修复评审意见 → 合入发布。这条流水线最核心的设计洞察是：每个阶段都有明确的"人做决策"节点（审批计划、确认部署、审核报告、决定提交哪些评论），AI 则在各阶段内自主执行重复性高、规则明确的工作。4 个 Task 的并行开发仅需 ~10 分钟且几乎无需人工干预，相比传统方式大幅缩短了从需求到可部署代码的周期。

AI 评审的局限性揭示了跨模型交叉审查的价值。 文章在阶段 9 明确指出了一个关键观察：AI 给出的评审意见"不一定都是对的"，可能误判代码意图、遗漏业务上下文，甚至把正确的错误处理标记为"缺少 error check"。为此，文章提出了一个实用技巧——谁写的代码，就让别的模型来审查。Claude 写的代码用 Codex 或 Gemini 审查，反之亦然。不同模型的知识结构和关注点不同，交叉审查能显著提高问题发现率。这个洞察触及了当前 AI 代码评审的一个根本性局限：同模型的审查容易陷入与生成时相同的思维盲区。

Skill 编排而非从零实现的设计哲学。 pm-dev 早期版本曾经自己实现了头脑风暴/写计划/执行计划的功能，后来发现 superpowers 插件已经提供了成熟的对应 Skill，最终把自制逻辑替换为链式调用现成 Skill。这个教训被总结为一句话："自定义 Skill 的核心价值是编排和串联，而不是从零实现所有能力"。对于 Agentic Engineering 的工具生态建设具有普遍指导意义——与其在每个 Skill 里重复实现复杂的工作流逻辑，不如设计好 Skill 之间的调用契约，让成熟的 Skill 各司其职，编排层负责串联和上下文传递。

实践启示¶

构建分层工具链，Command 只做薄路由。 每个 /xxx 命令应该只有一行委托逻辑，核心业务逻辑放在 Skill 层。这样即使用户没有显式调用命令（如说"帮我提交代码"），AI 也能理解意图并触发对应流程。
用 Superpowers 类结构化 Skill 强制工程纪律。 brainstorming 确保 AI 先理解代码现状再动手，writing-plans 确保先有计划再执行，executing-plans 确保按步骤推进不跳跃。这些不是"可选的好习惯"，而是写进 Skill 定义的强制流程——AI 无法跳过关键步骤，必须在每个节点停下来等人审核。
代码自审和 AI 辅助评审形成双层质量门禁。 阶段 5 的 code-review 定位是"自查"——用 AI 快速扫格式、命名、规范类低级问题，让人审聚焦更高层面的设计和逻辑；阶段 9 的 /review-mr 则是站在 reviewer 角度做正式审查。两者定位不同、目标不同，形成互补的两道质量门禁。
跨模型审查避免同模型思维盲区。 不要让同一个模型既写代码又审代码。Claude 写的代码用 Codex 或 Gemini 审查，利用不同模型知识结构的差异性发现更多问题。每一条 AI 评审意见都必须经过人工判断，不能因为是 AI 说的就直接采纳。
优先复用成熟 Skill，自研聚焦编排层。 当需要某个功能（如 brainstorming、writing-plans）时，优先评估社区是否已有成熟实现，避免从零实现所有能力。自定义 Skill 的核心价值是编排和串联——把多个现有 Skill 串联成满足特定业务场景的流水线，而不是重复发明轮子。

从Vibe Coding到Agentic Engineering：重构后台开发全流程¶

Ch04.366 从Vibe Coding到Agentic Engineering：重构后台开发全流程¶

从Vibe Coding到Agentic Engineering：重构后台开发全流程¶

相关实体¶

深度分析¶

实践启示¶