Agent 时代,我们架构师应该学什么?¶
Ch04.346 Agent 时代,我们架构师应该学什么?¶
📊 Level ⭐⭐ | 7.3KB |
entities/agent-era-architect-skills-guide.md
Agent 时代,我们架构师应该学什么?¶
架构师(JiaGouX) 我们都是架构师! 这两天朋友丢过来一篇 Rohit 写的长文,讲 2026 年做 AI Agent 该学什么、构建什么、跳过什么。我一边读,一边把里面提到的框架、论文和网上讨论顺手过了一遍,信息量确实不小。
读到后面,我被提醒了一件更现实的事:Agent 这个领域变化太快。今天讲 LangGraph,明天讲 Mastra,后天又冒出一个新的 Agent SDK;模型也一样,这周这个工具调用更稳,下周另一个长上下文更强。真按这个节奏追,很容易被新闻流带着跑。
** Agent 时代,架构师到底应该学什么,哪些能力半年后还站得住? **
→ 原文存档
深度分析¶
-
筛选比路线图更耐用——用"半衰期"思维过滤 Agent 新工具 文章指出在 Agent 领域 "filter 比 feed 更重要"。模型封装层、CLI 参数、某个"类 Devin 产品"的半衰期通常很短;协议、状态、沙箱、评估、工具契约这些东西,半衰期会长很多。这意味着架构师应优先投资协议、状态管理、沙箱、评估体系等底层系统能力,而非追逐新的框架封装层。
-
上下文是运行时工作集,而非聊天记录 文章强调 Agent 跑长任务时很多失败表面看是"模型没想明白",往里看常常是上下文坏了。上下文窗口更像运行时工作集,需要分层设计:模型窗口承载当前目标和关键约束、会话状态承载任务计划和已完成动作、文件/数据库承载大对象和日志、项目规范承载 AGENTS.md 和团队约定、工具层承载检索和写入动作。Claude Code 92% 缓存命中率的背后,正是稳定内容和动态内容分得很干净的结果。
-
工具是业务接口,5-10 个清晰工具胜过 20 个模糊工具 文章指出模型不是人类工程师——人看到 400 Bad Request 会自己翻文档,模型只能靠工具的名字、描述、参数、返回和错误消息理解外部世界。工具描述应作为接口文档来写:写宽了模型会滥用,写窄了模型不敢用,返回太多窗口会变脏,错误太抽象模型会重复犯错。MCP 协议值得关注,因为它把工具、资源、能力边界拆开,让 Agent 不必靠自定义胶水代码理解外部系统。
-
Harness 是模型和真实工作之间的运行底座,而非薄壳 文章明确提出"模型决定能力上限,Harness 决定生产下限"。短任务里 Harness 看着像执行壳,长任务一跑起来就会撞上后端同样的问题:状态、队列、日志、权限、恢复、审计、成本。模型升级后 Harness 不一定只需要加东西,有时也要删东西——旧 prompt、旧工具包装、旧规则原本是为老模型补短板加上去的,模型能力变强后可能反而成为负担。
-
评估前置是 Agent 进入生产的必要条件 文章将评估类比为 Agent 的单元测试:不保证系统永远正确,但至少能让团队知道这次改动有没有把昨天还正常的能力搞坏。没有评估层,团队很容易陷在体感讨论里——换了模型感觉更聪明,压短了提示感觉更省,但具体哪类任务变好、哪类退化,谁也说不清。内部评估集最好从真实 trace 里长出来,即使只有五十条样本也比没有强。
实践启示¶
-
建立框架/工具的半衰期评估清单 面对任何新的 Agent 框架或工具,用三个问题评估:半年后它还重要吗(是协议/状态/沙箱/评估,还是只是包装层)?能接进现有系统吗(要不要推翻已有的日志、权限、配置)?能被评估吗(能不能用 trace 和样本证明它让 Agent 变好)?
-
重新设计上下文的分层架构 不再把所有资料一股脑塞进上下文窗口,每轮先问:当前推理最需要哪几块信息?哪些只要摘要?哪些大对象应留在文件/数据库/检索系统里?工具输出给 preview 就够,还是要完整展开?历史压缩后任务还能不能继续推进?
-
把工具描述当成接口文档来写 每个工具至少要让模型看懂:什么时候该用、什么时候不该用、参数填什么、返回里哪些是关键结果、失败后下一步怎么修、危险动作有没有权限和确认。优先保证命名干净、参数边界明确、错误消息可执行、返回格式有上限、大结果可分页。
-
主力模型升级时做 Harness 清理 每次主力模型升级时,顺手检查:哪些静态上下文可以改成动态拉取?哪些工具包装可以退回更通用的接口?哪些系统提示其实在限制新模型?哪些错误处理逻辑已经不再承重?哪些压缩策略正在伤害任务状态?
-
从真实 trace 中建立内部评估集,从小闭环开始 上线前先做一版哪怕粗糙的评估,从真实 trace 里积累样本,第一次即使只有五十条也比没有强。落地时从一个窄目标、可度量、可回滚的小闭环开始:明确目标 + 单 Agent 主循环 + 3-7 个边界清楚的工具 + 窗口外状态层 + 沙箱 + trace + 初始评估样本 + 能回滚的发布方式。
相关阅读¶
- Harness Engineering 框架 — Agent 运行底座的系统性方法论
- 上下文工作集管理 — 上下文作为运行时工作集的具体实践
- Harness 正在成为新后端 — 从后端视角看 Agent 作为新调用方
- Model Context Protocol — 文章中提到的工具协议方向
- 上下文工程三种记忆范式 — 状态分层设计的进一步参考