高德 Marketing AutoResearch:营销增长 AI Native 经营托管框架¶
Ch04.078 高德 Marketing AutoResearch:营销增长 AI Native 经营托管框架¶
📊 Level ⭐⭐ | 17.9KB |
entities/gaode-marketing-autoresearch-ai-native-practice.md-> 原文存档
高德 Marketing AutoResearch:营销增长 AI Native 经营托管框架¶
一句话¶
高德信息业务中心 2026-06-09 发布的 Marketing AutoResearch——面向"长期经营研究问题"的 AI Native 经营托管框架,由人定义目标/约束/可行动空间/治理边界,Agent Team 在业务协议边界内持续假设→小步实验→真实反馈→经验沉淀循环迭代。3 层技术架构 + 5 层解耦工程实现,5 个真实脱敏案例验证:年度化利润增量千万级,7 小时 5 次自主决策,零人工介入。
核心问题:营销系统的"结构性断层"¶
算法模型已经能预测用户转化、补贴弹性、策略收益,但真实经营决策仍大量依赖人工看盘/解释/调参/复盘。模型给出"局部信号",业务需要"连续决策";系统能算一次策略,但很难长期回答:哪里加力、哪里收缩、哪里是噪声、哪里值得继续试。
核心场景:营销发券 / 补贴分配 / 城市策略 / 人群分层 / 节假日节奏。反馈每天更新、风险每天重评——一次性分析/报告/调参无法支撑长期经营优化。
三大技术架构¶
1. 业务协议 (Business Protocol) — 给 Agent 一块可安全研究的实验场¶
第一层不是 prompt,而是业务协议——把过去依赖人工经验判断的运营规则转化为机器可执行、可审计、可版本化的生产边界。
核心价值: - 不把 Agent 绑死 - 给 Agent 安全、可控、可验证的研究空间 - 没有协议 → Agent "自治"变成越权 - 有了协议 → Agent 能在明确授权内持续探索
2. Agent Team — 多角色协作¶
经营决策不是单点动作,而是一条生产链路:
看见现象 → 解释变化 → 生成动作 → 通过安全门 → 小流量执行 → 读取反馈 → 沉淀经验 → 下一轮继续
关键原则:LLM 不直接承担修改线上参数的风险角色,而是承担研究员 / 审稿人 / 复盘者角色;确定性工具负责计算 / 求解 / 安全 / 发布。
架构价值:发挥大模型在推理/解释/假设生成上的能力,同时避免模型直接越过生产系统风险边界。
3. 真实反馈 — 让策略接受业务验证¶
AutoResearch 与普通 Agent 最大区别:不以"生成答案"为终点,而以"真实反馈"为下一轮起点。
- 系统持续读取实验桶 / 对照桶 / 归因窗口 / 长期指标
- 有效策略 → 经验沉淀
- 无效策略 → 记录失败原因
- 高风险策略 → 安全门拦截或降级
核心论断:"这让 Marketing AutoResearch 从'会生成策略'升级为'能研究策略'。"
五层解耦工程实现¶
| 层 | 职责 | 独立演进 |
|---|---|---|
| 业务协议 | 治理边界、可行动空间、违规拦截 | 新增行业补齐协议 |
| 评估口径 | 真实反馈定义、实验桶/对照桶归因 | 新增场景补齐口径 |
| 工具适配 | 确定性计算、求解、安全、发布 | 新增策略动作注册工具 |
| Agent Team | 研究员 / 审稿人 / 复盘者多角色 | 通过 Runtime 编排接入 |
| Runtime | 编排、状态、可视化中枢、协作入口 | 增量添加新 Agent 角色 |
解耦价值:新增行业、新增策略动作、新增 Agent 角色都无需重写整套系统。
可视化中枢(7 大模块展示)¶
"在增长系统里,AI 最大的问题不是'不够聪明',而是'聪明但说不清'"
展示内容:当前观察、风险判断、动作生成、安全门通过、实验执行、反馈读取、经验沉淀——让 AI 的每一次判断都能被观察、被追溯、被复盘。
协作入口(5 类追问)¶
业务和算法同学可追问:当前为什么这个判断?风险信号是什么?实验执行情况?复盘结论?策略调整建议?让 AutoResearch 成为组织协作的一部分,而不仅是后台能力。
实践验证(5 个真实脱敏案例)¶
整体结果:在真实托管场景中实现规模、效率、用户侧核心指标同时胜出,年度化利润增量预期达到千万级。收益不是来自一次性大促加码,而是 Agent Team 在安全边界内持续做小步判断 + 小流量验证 + 资源再分配——把多个维度的边际改进累积成整体收益。
Case 1: 极端波动下的自动修复¶
某次业务波动中,核心利润指标快速下探接近预设防线。系统在 7 小时内自主完成 5 次决策,零人工介入:
- 识别风险 → 进入防守策略
- 风险继续扩大 → 进一步收缩低效补贴
- 边际指标开始改善 → 停止过度防守
- 继续收缩可能伤害有效交易 → 转向温和恢复
| 指标 | 数值 |
|---|---|
| 核心利润缺口 | -20% → -3% (收窄 17pp) |
| 核心交易指标 | 仍保持 +4% 正向增长 |
| 自主决策 | 5 次 / 7 小时 / 零人工介入 |
核心论断:"系统能在两个目标之间做动态仲裁:该防守时防守,该停止过度防守时也能停下来。"
Case 2: 外部事件不等于盲目加码¶
某大型线下活动 + 异常天气 → 系统识别到核心区域自然需求可能上升。传统直觉"热点来了就加补",Agent Team 判断: 当自然需求足够强时,继续加补可能只是补贴本来就会来的需求而非创造新增需求。
决策:核心区域维持保守水位,预算转向更具弹性的周边区域。
| 指标 | 数值 |
|---|---|
| 高弹性区域 | +8% 相对提升 |
核心论断:"AutoResearch 要判断的不是哪里热,而是哪里补了才真正有边际收益。"
Case 3: 节假日前的前置布局¶
长假前系统通过搜索热度 / 日历信息 / 历史弹性先验识别到出行需求进入提前预订窗口。前置三阶段布局:
- 假期前 → 高弹性区域小步探索,锁定早鸟需求
- 假期期间 → 自然需求增强后逐步收缩低弹性补贴
- 低弹性区域 → 维持基准或小步观察,避免"节日一刀切"
核心论断:"AutoResearch 不只是事后复盘,也能把外部信号转成提前布局。它开始具备经营节奏感。"
Case 4: 从失败维度中重新发现机会¶
某分层维度早期实验表现不佳(人工直觉会判断"不值得继续投"),但系统在后续模型更新中发现真实弹性可能被低估 → 调整投资分数并重新分配资源。
| 阶段 | 指标 |
|---|---|
| 早期 lift | 0.958(落后基准 -4.2%) |
| 重新分配后 | 连续 5 天 lift > 1.0,峰值 ~1.053 |
| 6 天平均 | ~1.020(从负向维度转为正向) |
核心论断:"AutoResearch 的强项不是一次判断永远正确,而是发现自己可能判断错了以后,能用新数据修正。"
Case 5: 多区域并行学习¶
(节选可见) —— 系统支持多区域并行实验,每区域独立判断 + 全局经验沉淀。
深度分析¶
与现有 AutoResearch 实体的差异化定位¶
现有 AutoResearch entities 全部聚焦科研 / 软件开发域:
| 现有 entity | 应用域 | 核心方法 |
|---|---|---|
| AI 自主科研 L0-L4 (6KB) | 科学发现 (AlphaFold / The AI Scientist) | L0-L4 五级自主性框架 |
| AutoResearch 多 Agent 软件开发 (14KB) | 软件开发 (Codex / Claude Code) | 多 Agent 异步 + 评审者回路 |
| Karpathy AutoResearch (Query Engine Bug) | 个人研究循环 | Nightly research loop |
高德 Marketing AutoResearch 是第四个独立 AutoResearch 范式:
| 维度 | 高德 Marketing AutoResearch |
|---|---|
| 应用域 | 营销增长(业务托管) |
| 核心抽象 | 业务协议 + Agent Team + 真实反馈 |
| 决策粒度 | 城市级 / 分层 / 节假日(百万元级预算) |
| 关键创新 | 业务协议 (governance boundary) + 真实反馈 (real feedback loop) |
| 业务结果 | 7 小时 5 次自主决策收窄 -20% → -3% 利润缺口 |
| 哲学 | 人定义边界,Agent 在边界内自治 |
与 多 Agent 软件开发 的方法论共鸣: - 同样强调多 Agent 角色分工(研究员 / 审稿人 / 复盘者 ≈ Planner / Reviewer / Reflector) - 同样重视真实反馈(业务结果 ≈ 单元测试 / Linter / 编译) - 同样需要安全门/边界(业务协议 ≈ CI/CD Pipeline) - 区别:营销域的"实验桶/对照桶"是更复杂 A/B 测试基础设施(不同城市/分层/时段),软件开发域的"测试"更结构化
与高德 AI Native 系列的内部一致性¶
高德"超级应用的 AI 原生研发模式"系列已有:
| 期 | 主题 | 核心 entity |
|---|---|---|
| 第 1-2 期 | (背景调研) | 待补充 |
| 第 3 期 | 7×24 Self-Healing Pipeline + Agent 自进化 (研发生产线) | Gaode Ai Native 7X24 Pipeline Self Healing (30KB) |
| 第 4 期 (本期) | Marketing AutoResearch (营销增长托管) | 本文 |
两条线的并列: - 研发生产线:人定义规则和边界 → AI 在规则内自主决策 → 7×24 永动 (CI/CD 自闭环) - 营销增长线:人定义目标和边界 → Agent Team 在边界内持续实验 → 经营托管 (实验/反馈闭环)
核心思想一致:"人定义规则和边界,AI 在规则内自主决策和执行"——研发线强调"操作执行→决策审查",营销线强调"工具调优→决策智能"。
与 高德 AI Companion Agent 架构 的层级关系¶
- AI Companion Agent:C 端用户交互(智能助手)
- AI Native 生产线:B 端研发提效(CI/CD 自愈)
- Marketing AutoResearch:B 端业务提效(营销托管)
高德 AI 战略的三层落地:C 端用户助手 / 内部研发工具 / 业务决策托管——形成完整的"AI Native 业务操作系统"。
与 Harness Engineering 的深度共鸣¶
业务协议 = Harness 在业务域的具象化: - Harness 提供环境治理(CI/CD、Review、Test) - 业务协议提供经营治理(合规、预算、风险边界)
真实反馈 = Harness 反馈循环的业务版: - Harness 反馈来自 CI 流水线 - 业务反馈来自业务结果(GMV / 利润 / 转化率)
Agent Team = Harness 内的多 Agent Runtime: - Harness Runtime 调度多个 Agent - 业务协议约束 Agent 行为边界
"决策智能" vs "工具调优"的范式跃迁¶
从工具调优到决策智能是本文核心论断——这一范式跃迁体现在:
- 目标变化:从"模型预测准确率" → "经营结果(GMV/利润)"
- 决策变化:从"一次性输出" → "连续决策仲裁"
- 反馈变化:从"离线评估" → "线上实时反馈"
- 责任变化:从"工具辅助" → "业务托管"
这是 高德 SDD Harness 团队 AI 编码范式 的业务侧对应——SDD 关注"代码的正确性",AutoResearch 关注"决策的正确性"。
实践启示¶
- 业务协议优先:在 Agent 上线前先把"什么能做、什么不能做、如何判断好坏、出现风险如何停止"定义清楚(业务协议第一,不是 prompt 第一)
- 风险角色交给确定性工具:LLM 只承担研究员/审稿人/复盘者,发布/计算/安全交给工具
- 可视化中枢是组织采纳前提:AI 必须"可被观察、被追溯、被复盘"才能被业务信任
- 实验桶/对照桶是关键基础设施:没有 A/B 实验基础设施就无法做"真实反馈"循环
- 失败维度值得重新投资:早期失败的分层维度,如果后续模型更新发现真实弹性被低估,应重新分配资源
与已有实体的差异化定位¶
- vs AI 科研 L0-L4 — 科学发现域,本文是营销业务域
- vs 多 Agent 软件开发 — 软件开发域,本文是营销业务域
- vs 高德 7x24 Self-Healing Pipeline — 同公司研发线,本文是营销业务线
- vs 高德 AI Companion Agent — C 端用户交互,本文是 B 端业务托管
- vs 天猫营销 AI 工作流 — 营销自动化,本文是营销研究(研究 + 实验 + 反馈循环)
- vs 火山引擎营销策略 Agent — 营销决策支持,本文是业务托管(Agent 直接调整预算)
上线状态¶
- 发布: 2026-06-09 17:45(高德技术公众号)
- 作者: 高德信息业务中心(业务 + 算法联合作战)
- 业务结果: 年度化利润增量预期千万级