TiDB Cloud — Agent-native 数据库与 Kimi K2.6 合作¶
Ch11.077 TiDB Cloud — Agent-native 数据库与 Kimi K2.6 合作¶
📊 Level ⭐⭐ | 10.7KB |
entities/tidb-cloud-agent-database.md
核心概念¶
Agent-native 时代的数据 Infra 竞争逻辑¶
过去 30 年:比单点性能(TPS、延迟、单库容量)。 现在比的是当以下四件事同时发生时,谁能提供最顺畅的体验: 1. 海量长尾租户:请求量不大,但全都要求在线 2. LLM 即席改 Schema:必须支持分支和多版本 3. 无法预测的突发流量 4. AI 在秒级别随时动态创建/销毁以及动态生成 SQL
Kimi K2.6 为什么选 TiDB Cloud¶
放弃 Supabase:每个 Agent 配一个 PostgreSQL 实例 → 上百万实例成本爆炸。 放弃 PostgreSQL 多 Schema 隔离:单实例万级规模扛不住,流控/故障隔离都是问题。 核心原因:成本,需要完全不同的架构思路。 选 TiDB 的核心原因不在单点指标极致,而在「per-tenant 多租隔离、统一栈、即时弹性」三件事同时做到位。
架构核心:虚拟数据库层¶
传统 Serverless 数据库的问题:每个 Sandbox 分配一个真实 DB 实例 → 冷却回收、无法 7×24 在线、成本随数量线性增长。 TiDB Cloud 方案:
- 无真实数据库实例,一切都是虚拟的
- 对 Agent 来说仍拥有完整独立数据库
- 物理层:底层大型分布式 KV 数据库封装对象存储
- 逻辑层:自动处理数据可见性隔离和冷热分离
- 结果:弹性能力提升一个台阶,成本数量级下降
三大战略决策(Kimi K2.6 能做成的关键)¶
1. 最小化 Agent 使用 Infra 工具时的摩擦¶
Warm Pool + Scale-To-Zero:Agent 在 1 秒内拿到 fully prepared 的数据库实例。 如果 provisioning 需要几分钟,Agent 就得写 retry/poll/wait —— 这个负担不该由 Agent 扛。
2. 统一技术栈¶
多使用 Skill 中写好的技术栈和最佳实践,少跨一个系统就少一类 bug,提升生成代码变服务的稳定性。
3. 极致低成本¶
放弃真实 DB 实例分配管理,引入虚拟数据库界面:
- 长尾请求不需要真实分配实例
- 最极端情况:整个平台只需一个常驻 DB Session Gateway 维持连接
- 其他所有资源弹性伸缩
行业收敛:one agent, one sandbox, one storage, one database¶
一个用户身边可能有 10 个甚至 100 个 Agent 在跑,每个都需要自己的状态和数据。 包括 Kimi 在内的 AI Agent 商业化团队架构都收敛到同一范式:
- one agent
- one sandbox
- one storage
- one database
上半场 vs 下半场¶
- 上半场:谁的模型更聪明、谁的 Agent 推理更长
- 下半场:Agent 交付的结果能否在真实用户面前稳定跑起来、持续交付 model厂商通过好的基础设施服务(TiDB Cloud)→ 快速高效提供更多价值。
深度分析¶
虚拟数据库层:Agent-native 数据库的核心架构突破¶
传统数据库架构在面对 Agent 场景时暴露根本性局限:每个 Sandbox 分配真实 DB 实例 → 冷却回收、无法 7×24 在线、成本随数量线性增长。 TiDB Cloud 的解法是在物理层和逻辑层之间引入虚拟数据库界面:物理层由底层大型分布式 KV 数据库封装对象存储;逻辑层自动处理数据可见性隔离和冷热分离。对 Agent 而言仍拥有完整独立数据库体验,但物理层无需为每个租户分配真实实例。 这一设计的核心价值:弹性能力提升一个台阶,成本数量级下降——长尾请求不需要真实分配实例,最极端情况下整个平台只需一个常驻 DB Session Gateway 维持连接,其他所有资源均可弹性伸缩。
竞争逻辑的根本转变¶
过去 30 年数据库竞争:比单点性能(TPS、延迟、单库容量)。Agent-native 时代的竞争逻辑已完全改变——当以下四件事同时发生时,谁能提供最顺畅体验成为关键: 1. 海量长尾租户:请求量不大,但全都要求在线 2. LLM 即席改 Schema:必须支持分支和多版本 3. 无法预测的突发流量 4. AI 在秒级别随时动态创建/销毁以及动态生成 SQL 这是完全不一样的赛道,单点指标极致不再是核心竞争优势,「per-tenant 多租隔离、统一栈、即时弹性」三件事同时做到位才是。
"one agent, one database" 范式的行业收敛意义¶
12 个月内陪跑国内外多个 AI Agent 团队基建选型,发现架构收敛到同一范式:
- 以前模式:一个产品扛亿级用户,一个 app 扛亿级会话
- 现在模式:一个用户身边可能有 10 个甚至 100 个 Agent 在跑,每个都需要自己的状态和数据 这意味着基础设施层必须支持前所未有的密度和隔离级别。Kimi 选择 TiDB 而非 Supabase/NeonDB 的核心原因正是成本——每个 Agent 配一个 PostgreSQL 实例上百万规模成本爆炸,PostgreSQL 多 Schema 隔离在万级规模也扛不住流控和故障隔离问题。
上半场到下半半场的竞争转移¶
AI Agent 竞争已从「模型更聪明、Agent 推理更长」的上半场,转向「Agent 交付的结果能否在真实用户面前稳定跑起来、持续交付」的下半场。 这一转变意味着基础设施服务(Database、Storage、Compute)的稳定性、成本效率、可扩展性将成为 Agent 商业化团队的核心决策因素——模型厂商通过好的基础设施服务快速高效提供更多价值将成为主流路径。
实践启示¶
对 AI Agent 团队的基础设施选型建议¶
- 优先选择最小化 Agent 使用摩擦的基础设施:如果数据库 provisioning 需要几分钟,Agent 就得写 retry/poll/wait,这个负担不该由 Agent 扛。Warm Pool + Scale-To-Zero 让 Agent 在 1 秒内拿到 fully prepared 的数据库实例是关键指标。
- 技术栈统一性影响生成代码稳定性:少跨一个系统就少一类 bug,多用 Skill 中写好的技术栈和最佳实践,而不是每次靠思考和抽卡——这直接关系到生成代码变成服务的成功率。
- 极致低成本是 Agent-native 场景的生存前提:放弃真实 DB 实例分配管理,引入虚拟数据库界面——长尾请求不需要真实分配实例,最极端情况整个平台只需一个常驻 DB Session Gateway,其他所有资源弹性伸缩。
对数据库基础设施提供商的启示¶
- 多租隔离 + 即时弹性 = 核心竞争力:在「海量长尾租户 + LLM 即席改 Schema + 突发流量 + 秒级动态创建销毁」同时发生的场景下,per-tenant 多租隔离、统一栈、即时弹性三件事同时做到位比单点性能更重要。
- 虚拟数据库层是解决成本爆炸的关键:物理层大型分布式 KV 封装对象存储 + 逻辑层自动处理数据可见性隔离和冷热分离,可以实现弹性能力提升一个台阶、成本数量级下降。
- Agent 体验指标比传统数据库指标更重要:无回收、无休眠、无连接中断——这些 Agent 体验指标是 Agent-native 时代数据库的核心评估维度。
行业趋势判断¶
- "one agent, one sandbox, one storage, one database" 将成为标配:随着单个用户身边的 Agent 数量从 1-2 个增长到 10 个甚至 100 个,每 Agent 独立数据库的范式将覆盖从建站到通用 Agent 的所有场景。
- 基础设施层创新将成为 Agent 商业化竞争的关键变量:模型能力趋同的情况下,Agent 交付稳定性和成本效率将成为下半场竞争的核心战场。
→ 原文存档