如何构建生产准备的AI代理：MCP、CLI与技能——适合合适的工作的工具¶

Ch07.052 如何构建生产准备的AI代理：MCP、CLI与技能——适合合适的工作的工具¶

📊 Level ⭐⭐ | 5.1KB | entities/production-ai-agents-mcp-cli-skills-stack-ayi.md

如何构建生产准备的AI代理：MCP、CLI与技能——适合合适的工作的工具¶

来源：啊镒opc实验基地（2026-05-26）| 原文存档：原文存档

深度分析¶

本文系统梳理了 2026 年 AI Agent 生产部署的连接技术栈：Skills（领域知识）、MCP（模型上下文协议）、CLI（命令行执行）。核心论点是三者不是互斥选择，而是互补层——顶级 Agent 使用所有三层。

连接技术栈三层模型¶

Skill（领域知识）：可重用的程序指令和 Markdown 文件，教导模型如何使用工具。可跨客户端移植，从本地目录或远程仓库加载。负责复杂任务的上下文和领域知识。

CLI / 计算机使用（本地执行）：Unix 风格连接，高 token 效率（每响应约 200 token），利用模型预训练知识（git、gh、curl 等）。通过包管理器安装标准二进制文件。

MCP（连接组织）：提供丰富语义、平台独立性和企业功能（OAuth、治理策略、审计追踪）。通过代码定义工具/资源/提示，JSON-RPC 2.0 over HTTP/SSE 通信。适合需要确定性、授权和平台独立的场景。

MCP 的 Token 开销问题与解决¶

MCP 的主要缺点：简单实现中，提前加载所有工具模式可能消耗 44,000–55,000 token 上下文。

解决策略： - 渐进式发现（Progressive Discovery）：不将所有工具放入上下文窗口，将工具加载推迟到模型实际需要时。通过 tool_search 功能按需加载，可将上下文使用减少 5 倍。 - Annotated Tool Definitions：使用描述性函数名、参数名并标注参数描述，帮助 LLM 精确知道期望，减少推理失败。

程序化工具调用（代码模式）¶

传统顺序工具调用的问题：依赖每个协调步骤的推理延迟，效率低。

代码模式解决方案：为模型提供执行环境（V8 隔离或 Python 沙盒），让其编写脚本一次性编排多个工具，而非多次顺序调用。

2026 MCP 路线图¶

无状态传输：Google 提出新型协议，简化 Kubernetes/Cloud Run 部署，TypeScript/Python SDK v2.0 将发布
跨应用访问：MCP 服务器间单点登录（公司身份提供商），服务器发现通过 .well-known/mcp-server-card/server.json 自动进行
MCP 上的技能：服务器附带工具使用领域知识，通过 skills/list 和 skills/get endpoints 交付

核心结论¶

没有统一解决方案。顶级 Agent 使用全部三层： - Skill = 领域知识（复杂上下文） - CLI = token 高效执行（预训练工具） - MCP = 安全连接性（企业级治理）

MCP 放弃会引发：身份验证碎片化、无审计追踪、供应商锁定。对大规模企业环境，连接纽带对于治理和安全至关重要。

实践启示¶

不要在 MCP vs CLI 之间选择，而是三层全用：根据任务类型选择正确层——预训练工具用 CLI，复杂上下文用 Skill，企业级集成用 MCP。
渐进式发现减少上下文消耗：使用 tool_search 按需加载工具，而非预加载全部，可减少 5 倍上下文使用。
Annotated 参数描述提升 MCP 工具调用成功率：描述性函数名/参数名 + 类型标注，让 LLM 精确知道期望，减少推理失败。
代码模式替代顺序工具调用：为 Agent 提供沙盒环境写编排脚本，减少多次 LLM 调用的累积延迟。
MCP 服务器设计原则：停止 REST API 一对一映射；设计具有明确意图的工具，为编排提供沙盒，发布 UI 资源。
关注 MCP 2026 路线图：无状态传输、跨应用 SSO、技能端点——企业级 MCP 生态正在快速成熟。

如何构建生产准备的AI代理：MCP、CLI与技能——适合合适的工作的工具¶

Ch07.052 如何构建生产准备的AI代理：MCP、CLI与技能——适合合适的工作的工具¶

如何构建生产准备的AI代理：MCP、CLI与技能——适合合适的工作的工具¶

深度分析¶

连接技术栈三层模型¶

MCP 的 Token 开销问题与解决¶

程序化工具调用（代码模式）¶

2026 MCP 路线图¶

核心结论¶

实践启示¶

相关实体¶