Agent 时代，我们架构师应该学什么？¶

Ch04.346 Agent 时代，我们架构师应该学什么？¶

📊 Level ⭐⭐ | 7.3KB | entities/agent-era-architect-skills-guide.md

Agent 时代，我们架构师应该学什么？¶

架构师（JiaGouX）我们都是架构师！这两天朋友丢过来一篇 Rohit 写的长文，讲 2026 年做 AI Agent 该学什么、构建什么、跳过什么。我一边读，一边把里面提到的框架、论文和网上讨论顺手过了一遍，信息量确实不小。

读到后面，我被提醒了一件更现实的事：Agent 这个领域变化太快。今天讲 LangGraph，明天讲 Mastra，后天又冒出一个新的 Agent SDK；模型也一样，这周这个工具调用更稳，下周另一个长上下文更强。真按这个节奏追，很容易被新闻流带着跑。

** Agent 时代，架构师到底应该学什么，哪些能力半年后还站得住？ **

→ 原文存档

深度分析¶

筛选比路线图更耐用——用"半衰期"思维过滤 Agent 新工具 文章指出在 Agent 领域 "filter 比 feed 更重要"。模型封装层、CLI 参数、某个"类 Devin 产品"的半衰期通常很短；协议、状态、沙箱、评估、工具契约这些东西，半衰期会长很多。这意味着架构师应优先投资协议、状态管理、沙箱、评估体系等底层系统能力，而非追逐新的框架封装层。
上下文是运行时工作集，而非聊天记录 文章强调 Agent 跑长任务时很多失败表面看是"模型没想明白"，往里看常常是上下文坏了。上下文窗口更像运行时工作集，需要分层设计：模型窗口承载当前目标和关键约束、会话状态承载任务计划和已完成动作、文件/数据库承载大对象和日志、项目规范承载 AGENTS.md 和团队约定、工具层承载检索和写入动作。Claude Code 92% 缓存命中率的背后，正是稳定内容和动态内容分得很干净的结果。
工具是业务接口，5-10 个清晰工具胜过 20 个模糊工具 文章指出模型不是人类工程师——人看到 400 Bad Request 会自己翻文档，模型只能靠工具的名字、描述、参数、返回和错误消息理解外部世界。工具描述应作为接口文档来写：写宽了模型会滥用，写窄了模型不敢用，返回太多窗口会变脏，错误太抽象模型会重复犯错。MCP 协议值得关注，因为它把工具、资源、能力边界拆开，让 Agent 不必靠自定义胶水代码理解外部系统。
Harness 是模型和真实工作之间的运行底座，而非薄壳 文章明确提出"模型决定能力上限，Harness 决定生产下限"。短任务里 Harness 看着像执行壳，长任务一跑起来就会撞上后端同样的问题：状态、队列、日志、权限、恢复、审计、成本。模型升级后 Harness 不一定只需要加东西，有时也要删东西——旧 prompt、旧工具包装、旧规则原本是为老模型补短板加上去的，模型能力变强后可能反而成为负担。
评估前置是 Agent 进入生产的必要条件 文章将评估类比为 Agent 的单元测试：不保证系统永远正确，但至少能让团队知道这次改动有没有把昨天还正常的能力搞坏。没有评估层，团队很容易陷在体感讨论里——换了模型感觉更聪明，压短了提示感觉更省，但具体哪类任务变好、哪类退化，谁也说不清。内部评估集最好从真实 trace 里长出来，即使只有五十条样本也比没有强。

实践启示¶

建立框架/工具的半衰期评估清单 面对任何新的 Agent 框架或工具，用三个问题评估：半年后它还重要吗（是协议/状态/沙箱/评估，还是只是包装层）？能接进现有系统吗（要不要推翻已有的日志、权限、配置）？能被评估吗（能不能用 trace 和样本证明它让 Agent 变好）？
重新设计上下文的分层架构 不再把所有资料一股脑塞进上下文窗口，每轮先问：当前推理最需要哪几块信息？哪些只要摘要？哪些大对象应留在文件/数据库/检索系统里？工具输出给 preview 就够，还是要完整展开？历史压缩后任务还能不能继续推进？
把工具描述当成接口文档来写 每个工具至少要让模型看懂：什么时候该用、什么时候不该用、参数填什么、返回里哪些是关键结果、失败后下一步怎么修、危险动作有没有权限和确认。优先保证命名干净、参数边界明确、错误消息可执行、返回格式有上限、大结果可分页。
主力模型升级时做 Harness 清理 每次主力模型升级时，顺手检查：哪些静态上下文可以改成动态拉取？哪些工具包装可以退回更通用的接口？哪些系统提示其实在限制新模型？哪些错误处理逻辑已经不再承重？哪些压缩策略正在伤害任务状态？
从真实 trace 中建立内部评估集，从小闭环开始 上线前先做一版哪怕粗糙的评估，从真实 trace 里积累样本，第一次即使只有五十条也比没有强。落地时从一个窄目标、可度量、可回滚的小闭环开始：明确目标 + 单 Agent 主循环 + 3-7 个边界清楚的工具 + 窗口外状态层 + 沙箱 + trace + 初始评估样本 + 能回滚的发布方式。

Agent 时代，我们架构师应该学什么？¶

Ch04.346 Agent 时代，我们架构师应该学什么？¶

Agent 时代，我们架构师应该学什么？¶

深度分析¶

实践启示¶

相关阅读¶