别再把上下文当聊天记录¶

Ch01.456 别再把上下文当聊天记录¶

📊 Level ⭐⭐ | 7.8KB | entities/别再把上下文当聊天记录.md

-> 原文存档从微信文章别再把上下文当聊天记录提取。

核心内容¶

source_url: https://mp.weixin.qq.com/s/ajurJ3Vayd9qLIwh9M3Fnw

主要章节¶

赌注：相信模型能管理自己的上下文¶
真正的工程难点：会话剪枝¶
子智能体上下文管理¶
设计在哪里收敛¶
参考阅读：¶

深度分析¶

「上下文不是聊天记录」这个论点的核心洞见在于：LLM 的上下文窗口并不是一个「记忆空间」，而是一个「工作空间」。聊天记录的形式（role / content 交替、时序排列）只是一个历史实现细节，并不对应 LLM 处理信息的最佳方式。会话剪枝（Session Pruning）的真正难点不是「保留哪些消息」，而是「保留哪些信息对当前子任务最有效」。「赌注：相信模型能管理自己的上下文」这个表述背后有一个深刻的设计哲学转变：传统软件开发中，开发者控制所有状态；在 Agent 系统中，开发者需要把状态管理权委托给模型，但同时提供足够的结构化约束。这个平衡点极其难找——给模型太多自由会导致不可预测行为，给太少又会让模型失去真正的推理能力。子智能体上下文管理是一个尚未被很好解决的工程问题。当一个复杂任务被分解为多个子 Agent 并行执行时，每个子 Agent 都需要自己的上下文切片，而这些切片之间如何保持信息一致性、如何处理交叉依赖（一个子 Agent 的输出是另一个子 Agent 的输入），目前的解决方案都还相当粗糙。

实践启示¶

Agent 系统设计者：不要把上下文当黑箱，不要假设「给模型越多的上下文越好」。正确的做法是：明确任务的上下文需求窗口（需要在多少 token 内完成），设计上下文注入策略（在何时注入何种信息），并在 Harness 层实现上下文预算控制。 会话管理实现者：在实现会话剪枝时，应该基于信息贡献度而非时间顺序来决定保留/丢弃哪些消息。可以利用嵌入相似度、注意力权重分析或小模型代理等方法来评估每条消息的信息价值，而非简单粗暴地保留最近 N 条消息。 多 Agent 系统架构师：子 Agent 之间的上下文共享应该通过结构化的「上下文边界」（Context Boundary）来实现，而不是通过把所有子 Agent 的上下文简单拼接在一起。每个子 Agent 应该只看到它完成任务所必须的最少上下文。

ai agent platforms topic map（已删除）

别再把上下文当聊天记录¶

Ch01.456 别再把上下文当聊天记录¶

核心内容¶

主要章节¶

赌注：相信模型能管理自己的上下文¶

真正的工程难点：会话剪枝¶

子智能体上下文管理¶

设计在哪里收敛¶

参考阅读：¶

深度分析¶

实践启示¶

相关实体¶