跳转至

AWS Graviton5 M9g/M9gd 实例 GA 公告

Ch11.087 AWS Graviton5 M9g/M9gd 实例 GA 公告

📊 Level ⭐⭐ | 10.2KB | entities/aws-graviton5-m9g-m9gd-launch-2026.md

AWS Graviton5 M9g/M9gd 实例 GA 公告

TL;DR:AWS 在 re:Invent 2025 预览后正式发布 M9g 实例 + 新增 M9gd(本地 NVMe SSD 版),均由 Graviton5 处理器驱动。192 核、DDR5-8800、PCIe Gen6,相比 Graviton4 计算性能 +25%、Web 应用 +35%、ML 推理 +35%、数据库 +30%。Meta 部署数千万核 Graviton 用于代理 AI 工作负载;ClickHouse / Honeycomb / HubSpot 公布对比 M8g 的实测收益。

三个独有贡献

  • 完整硬件规格表 — 这是 wiki 中唯一一份 Graviton5 处理器及 M9g/M9gd 全部实例大小的完整规格(vCPU、内存、网络带宽、EBS 带宽、本地 NVMe 存储)。
  • 官方客户验证数据 — ClickHouse(+36% vs M8g)、Honeycomb(+36% per-core throughput vs Graviton4)、HubSpot(MySQL 查询 -60% 时长)、Meta(千万级核部署代理 AI)。
  • Nitro Isolation Engine — 首个经形式验证的云虚拟机监控器,数学保证隔离性。

关键架构升级(vs Graviton4)

  • 计算性能: +25%
  • Web 应用程序: +35%
  • 机器学习推理: +35%
  • 数据库: +30%
  • L3 缓存: 5x(上一代)
  • 核心间延迟: 降低最多 33%
  • 内存: DDR5-8800
  • PCIe: Gen6
  • 核心数: 192

网络与存储带宽

  • 网络带宽: 比同类实例平均高 15%(最大实例最高 2x)
  • EBS 带宽: 比同类实例高 20%
  • 实例带宽配置(IBC): 可在 EBS 和 VPC 网络之间调节带宽分配最多 25%

M9g 实例规格(部分)

大小 vCPU 内存 (GiB) 网络 (Gbps) EBS (Gbps)
中型 1 4 高达 15 高达 12
8xlarge 32 128 17 12
24xlarge 96 384 50 36
48xlarge 192 768 100 72
metal-48xl 192 768 100 72

M9gd 实例(本地 NVMe SSD)

  • 存储量: 高达 11.4 TB NVMe SSD
  • 相比 M8gd: IOPS 和存储性能 +30%
  • 最大实例: 3 x 3800 GB NVMe SSD(48xlarge)

Nitro Isolation Engine(安全增强)

  • 形式验证(formal verification)保证虚拟机监控器隔离性
  • 首个经数学证明的云虚拟机监控器
  • 强制隔离:通过最小化 API 集,调解所有 VM 内存、CPU 寄存器、I/O 设备访问

客户案例

  • ClickHouse: 性能比 M8g +36%,代码更改为零
  • Honeycomb: 6 个月 A/B 测试,每核吞吐量比 Graviton4 +36%
  • HubSpot: MySQL 数据库查询时长 -60%
  • Meta: 部署数千万 Graviton 内核支持代理 AI 工作负载(实时推理、代码生成、多步骤任务编排)

适用工作负载

  • 通用: 应用服务器、微服务、中型数据存储、游戏服务器、缓存、容器化应用、大规模 Java 应用
  • 代理 AI: 实时推理、代码生成、工具调用、评估循环、多步骤编排
  • ML 推理、EDA、游戏、视频编码
  • M9gd 适合需要本地高速存储的: 数据日志、媒体处理、批处理、日志处理

可用区域

  • 美国东部(弗吉尼亚北部)
  • 美国东部(俄亥俄)
  • 美国西部(俄勒冈)
  • 欧洲(法兰克福)

采购选项

节省计划、按需实例、竞价型实例、专用实例、专属主机

与现有 Graviton 实体的差异化

实体 焦点 与本文关系
ai-graviton-migration-kiro-power-guide Kiro IDE 迁移到 Graviton 的开发者指南 互补:本文是硬件层,Kiro guide 是开发工具层
amazon-redshift-推出带有集成数据湖查询引擎的基于-aws-graviton-的-rg-实例 Redshift RG 实例(数据仓库) 平行:另一个基于 Graviton 的服务
openclaw-multi-7-ecs-fargate-graviton ECS Fargate + Graviton 部署 互补:本文是 EC2 实例,ECS Fargate 是编排层
build-multi-tenant-ai-agent-on-eks-graviton-openclaw-k8s-practice EKS + Graviton + OpenClaw 多租户 互补:本文是底层硬件规格
本文 aws-graviton5-m9g-m9gd-launch-2026 新硬件 GA 公告 唯一完整规格表来源

深度分析

1. Graviton5 vs Graviton4 架构演进:从单核优化到系统级协同

Graviton5 相比 Graviton4 的改进不只是时钟频率的提升,而是围绕 AI/代理 AI 工作负载的系统级重新设计。L3 缓存扩大 5 倍是最直接的改变——这直接影响代码执行效率,而内核间延迟降低 33% 则解决了多线程协作的瓶颈。配合 DDR5-8800 内存提供的高带宽,数据搬运不再成为 CPU 等待的主因。

2. 代理 AI 工作负载的 CPU 密集型特征

从回答问题到采取行动、运行代码、调用工具、评估结果、编排多步骤任务,代理 AI 实际上对 CPU 的需求远高于传统推理加速器。推理阶段需要大量串行逻辑处理,工具调用依赖低延迟网络,评估循环需要快速反馈。GPU 资源受限时,CPU 的计算能力和内存带宽直接决定了系统的并发吞吐量。

3. Arm 架构在云端渗透率:从边缘试探到核心锁定

经过五代定制硅芯片和八年投资,Graviton 已支持超过 350 种实例类型、12 万客户、多个托管服务。Meta 部署数千万核是最有力的背书——这代表超大规模云厂商已将 Arm 架构作为 AI 基础设施的默认选择。AWS 的策略很清晰:通过软硬协同优化,让客户无需修改代码就能获得性能提升,从而降低迁移门槛,加速替换 x86 进程。

4. 形式验证安全:Nitro Isolation Engine 的行业意义

Nitro Isolation Engine 是第一个经数学证明的云虚拟机监控器。形式验证意味着隔离性不是通过测试用例验证的,而是在数学层面可证的。这对金融、医疗等强合规场景是新的安全基线,AWS 也在用它区隔与竞争对手的差距。

5. 性价比压力与能效趋势

随着计算需求增长,能源效率成为云厂商和客户的共同约束。Graviton5 每代都提升能效,这对大规模部署尤其重要。

实践启示

  • 新代理 AI 部署的优先选择: M9g 192 核 + DDR5-8800 + PCIe Gen6 是 2026 年代理 AI 推理的官方推荐目标硬件
  • M9gd 适合需要临时数据暂存的场景: 媒体处理、数据日志、批处理 — 不需要外部 EBS 时延
  • Nitro Isolation Engine 提供数学保证的隔离: 对金融、医疗等强合规场景是新的安全基线
  • Meta 千万级核部署证据: 这是 2026 年最大规模的单一 CPU 供应商锁定案例,验证了 Arm 架构在 AI 工作负载上的成熟度
  • 零代码迁移收益显著: ClickHouse +36% vs M8g,证明从 M8g 迁移到 M9g 的性价比路径清晰
  • Honecomb 6 个月 A/B 测试数据: 每核吞吐量 +36% vs Graviton4,可作为企业评估的参考基准
  • HubSpot MySQL 查询 -60% 时长: 数据库类工作负载迁移优先收益明显,建议从数据库层切入迁移计划
  • DDR5-8800 + PCIe Gen6 组合: 云中迄今最快的内存子系统,是内存带宽敏感型工作负载(ML 推理、实时分析)的关键升级

相关资源

相关实体

原文存档