CMU Language Models Need Sleep (arxiv 2605.26099)：SSM-Attention 睡眠巩固机制¶

agent架构: 本文在agent方向提出的设计理念与实现路径
工程挑战: 实际落地中面临的关键问题与应对策略
architecture趋势: 相关技术演进方向与新兴范式

Ch01.689 CMU Language Models Need Sleep (arxiv 2605.26099)：SSM-Attention 睡眠巩固机制¶

📊 Level ⭐⭐ | 4.3KB | entities/arxiv-2605-26099-ssm-attention-sleep-consolidation-cmu.md

CMU Language Models Need Sleep (arxiv 2605.26099)：SSM-Attention 睡眠巩固机制涉及agent领域的核心技术议题。

CMU Language Models Need Sleep (arxiv 2605.¶
26099)：SSM-Attention 睡眠巩固机制

来源：机器之心编辑部 · CMU + 马里兰大学论文地址：https://arxiv.
26099 很长一段时间，「长上下文」一直是各大模型厂商军备竞赛的焦点，从 128K 到 1M，再到更长的上下文窗口，业界已然形成一个固有认知，只要窗口足够大，模型就能记住更多内容，也就能处理更长、更复杂的任务。
但问题也随之而来：上下文越长，KV Cache 越臃肿，不仅导致显存瞬间被「吃光」，推理速度愈发缓慢，成本也迅速上升。
更关键的是，把更多 token 放进窗口，并不等于模型真的把这些信息转化成了可推理的长期记忆，结果是，榜单分数越刷越高，可在一些需要「深度脑暴」的复杂推理任务中，模型常常因为「记不住细节」，频频翻车…… 面对这一两难问题，近日，卡内基梅隆大学（CMU）联合马里兰大学等在一篇新论文中提出了有意思的视角：既然人类连续工作久了会变笨，大模型也一样，既然如此为什么不让 LLM 睡一觉呢？