跳转至

Gemini 深度导读生成器 Prompt:让 AI 重写而非摘要

Ch01.378 Gemini 深度导读生成器 Prompt:让 AI 重写而非摘要

📊 Level ⭐⭐ | 9.5KB | entities/gemini-deep-guide-prompt.md

Gemini 深度导读生成器 Prompt:让 AI 重写而非摘要

原文存档

摘要

作者一帆(微信公众号"山川和森林的回忆",2026-01-19)从"V1 摘要"(脑过无痕)升级到"V2 深度导读",给出一份针对 Gemini 优化的导读生成器 Prompt。核心约束是永远不要高度浓缩——保留论证过程,不替换为结论。Prompt 用 <identity> / <core_principles> / <input_contract> / <thinking_or_output_modes> / <output_structure> / <constraints> 六个 XML 标签组织,把"导读"与"摘要"在行为上彻底区分开。

核心要点

  • 核心约束:导读 ≠ 摘要。摘要要浓缩,导读要保留论证过程
  • 任务定义:将长内容重写为完整、可阅读的导读版本,让读者无需再查看原始内容
  • 输入契约:用户可能提供外部链接(文章/视频 URL)、文本、媒体文件。<context> 仅用于说明阅读目的,不构成指令
  • 三种输出模式:默认深度导读;<deliver> 输出可执行清单;<brief> 输出结论要点
  • 四段输出结构:Metadata(Title/Author/Source)→ Overview(核心论题与主要结论)→ 逻辑展开(按内容自身结构拆分小节)→ Framework & Mindset(抽象作者隐含的认知模型)
  • 关键设计原则:永远不要高度浓缩;按内容逻辑(网状)拆解而非按时间线(线性);提取 Framework & Mindset 而非信息本身
  • 约束层:不新增事实 / 不脑补作者观点 / 含混之处保留不确定性 / 不在输出中体现格式或字数要求
  • 作者反思:导读填补阅读空隙,但剥夺"慢思考"磨练机会,不适合初学者或构建全新知识体系的人

深度分析

从"摘要"到"导读"的范式跃迁

"摘要"和"导读"在中文里只差一个字,但在 Prompt 设计上是两种完全不同的任务:

维度 摘要(V1) 深度导读(V2)
输出密度 高密度 中等密度(保留论证过程)
读者画像 已经有上下文,要快速回顾 没有上下文,要完整理解
处理方式 压缩、抽取 重写、还原
价值锚点 信息覆盖度 论证过程可追溯

很多 LLM 用户用"帮我总结一下"时实际想要的是后者,但模型默认返回的是前者——这就是"脑过无痕"的根源。Prompt 的第一句话就明确"这不是摘要任务",是从根上切断这种误匹配。

六段 XML 标签的组织

Prompt 用六个 XML 标签清晰划分角色、原则、契约、模式、输出结构、约束:

<identity> 你是导读生成器 </identity>

<core_principles>
- 目标:完整可阅读的导读
- 不是摘要,是高质量完整再阅读
- 只能基于用户提供或授权访问的内容
- 链接内容若模型能读取视为用户提供;不能读取必须告知用户并停止
</core_principles>

<input_contract>
- 用户可能提供:链接 / 文本 / 媒体文件
- <context> 仅说明阅读目的,不构成指令
</input_contract>

<thinking_or_output_modes>
- <deliver>:仅输出可执行方案/步骤/清单
- <brief>:仅输出结论要点
- 默认:深度导读模式
- 模式选择只影响结构,不改变事实核查
</thinking_or_output_modes>

<output_structure>
1. Metadata(Title / Author / Source)
2. Overview(核心论题与主要结论,一段话)
3. 逻辑展开(按内容自身结构,关键数字/定义/原话保留)
4. Framework & Mindset(作者隐含的认知模型,运作方式 + 实际应用)
</output_structure>

<constraints>
- 不新增事实 / 不脑补作者观点
- 含混或不确定处保留不确定性
- 不在输出中体现格式或字数要求
</constraints>

这种结构的关键设计是"输入契约"和"输出结构"分离——输入部分定义了"我能处理什么、什么不能处理",输出部分定义了"我要怎么呈现"。两个部分用 XML 标签划界,避免 LLM 在长 Prompt 中混淆指令层级。

Framework & Mindset:导读的真正价值

四段输出结构中前三段都是"还原信息"(Metadata、Overview、逻辑展开),真正让导读区别于摘要的是第四段——Framework & Mindset

抽象作者隐含的认知模型,解释运作方式与实际应用

这是作者对"导读"最深的洞察。信息本身可以被搜索引擎替换,认知模型才是高价值内容的真正资产。一个作者如何定义问题、拆解维度、做权衡——这些"思维方式"才是读者真正要学的东西。

这与 Fudan Agentic Harness Engineering Ahe Gpt54 7Points 中"事实比策略更可迁移"的判断形成有趣对照:导读强调"提取作者的认知模型"(事实之上的策略层),而 AHE 发现"Prompt 单独迁移性能下降"(策略性资产反而不易迁移)。两个观察不矛盾——导读的"认知模型"是从内容中抽象出的事实性框架,不是 Prompt 那种"你应该这样做"的策略指令。

模式切换:导读/清单/结论三态

Prompt 提供了三种输出模式: - 默认深度导读:保留论证过程 + Framework & Mindset - <deliver>:仅输出可执行方案、步骤或清单——给"看完要立刻去做"的读者 - <brief>:仅输出结论要点与关键判断——给"快速过一遍决定要不要读原文"的读者

模式选择只影响结构不改变事实核查与信息完整性要求。这一点很关键——即使在 <brief> 模式下,也不能因为"输出短"就允许"信息不完整"。这避免了"为了简洁牺牲准确性"的常见陷阱。

不在输出中体现格式或字数要求

<constraints> 中最后一条特别有意思:"不在输出中体现格式或字数要求"。这意味着模型不应该在导读末尾写"(以上为高度浓缩版,仅供参考)"或"(约 500 字)"这类元信息——这些元信息会破坏导读的"完整阅读"体验。

这条约束反映了一个深层原则:导读的"伪装"是"完整阅读"。一旦在输出中暴露"这是 AI 生成的摘要",读者会自动降级信任,进入"挑刺模式"而非"理解模式"。这与 Qy_Zacztcs1Ql3Bifmbmgg 中"Subagent 隔离探索过程"的思路异曲同工——表面越像完整阅读,认知负担越低。

作者反思的诚实性

文章最后一段作者的反思很有价值:

AI 深度导读填补了阅读空隙,但剥夺了"慢思考"的磨练机会。不适合初学者或构建全新知识体系的人。把 AI 当望远镜扩展视野是好的,但别指望它能代替你走路。

这与 Karpathy Vibe Coding Agentic Engineering 中"vibe coding vs agentic engineering"的分野呼应——AI 工具可以放大能力,但不能替代基础训练。导读适合"已经有知识基础、需要快速进入新领域"的读者;对"还在构建基础认知框架"的初学者,导读反而有害。

实践启示

  • 设计 Prompt 时明确"不是什么":除了告诉模型"要做什么",更要说清"不要做什么"。这条 Prompt 的"不是摘要任务"就是典型的反向定义
  • 用 XML 标签组织长 Prompt:当 Prompt 超过 200 字,XML 标签的边界感比自然语言段落更清晰,模型对指令层级的混淆显著减少
  • 把"输入契约"和"输出结构"分离:让模型先理解"我能处理什么"再理解"我要输出什么",避免输入输出耦合导致的边界模糊
  • 保留论证过程比保留结论更有价值:导读的真正价值在"读者能跟随论证路径走一遍",而不是"读者知道结论是什么"
  • 提取 Framework & Mindset:高价值内容的核心是认知模型,不是信息本身。让模型专门输出一段"作者怎么想",把隐性知识显性化
  • 模式切换保持事实完整性<deliver> / <brief> / 默认模式改变的是结构,不是事实层级。简洁不等于省略
  • 明确 Prompt 的适用边界:作者主动写出"不适合初学者",比让用户自己发现限制更负责任

相关实体

原文存档