Amazon Redshift 推出带有集成数据湖查询引擎的基于 AWS Graviton 的 RG 实例¶

Ch11.179 Amazon Redshift 推出带有集成数据湖查询引擎的基于 AWS Graviton 的 RG 实例¶

📊 Level ⭐⭐ | 6.1KB | entities/amazon-redshift-推出带有集成数据湖查询引擎的基于-aws-graviton-的-rg-实例.md

核心要点¶

AWS 技术实践
Amazon Redshift 推出带有集成数据湖查询引擎的

深度分析¶

架构定位：Graviton 驱动的性价比跃升¶

RG 实例是 Amazon Redshift 首次在数据仓库产品线中大规模采用 AWS Graviton 定制处理器。这一选择的底层逻辑与 AWS 近年来推动 Graviton 替代 Intel/AMD 实例的战略一脉相承——Graviton 基于 ARM 指令集，在并行批处理和内存密集型负载上实现了显著能耗比优势。官方标称数据仓库工作负载速度最高可达 RA3 实例的 2.2 倍，同时每个 vCPU 价格降低 30%，这一数字在性价比敏感的 analytical 场景中具有实际采购意义。

集成数据湖查询引擎：Spectrum 的终点¶

此次发布的另一个核心亮点是集成的数据湖查询引擎。在 RG 之前，Redshift 查询 S3 数据湖需要通过 Amazon Redshift Spectrum——一个独立的外部查询层，存在每 TB 扫描 5 美元的成本且查询延迟较高。现在 Redshift 在集群节点上直接执行数据湖查询，与数据仓库工作负载共用同一计算层。这一架构整合带来几个直接效果：无需重建外部表或修改应用代码，查询语法完全兼容现有 Spectrum 语法，且每 TB 扫描费用归零。对于同时运行数据仓库表和 Iceberg/Parquet 数据湖资产的混合工作负载，这是一个从"双引擎"到"单引擎"的架构简化。性能层面，对 Iceberg 格式可达 RA3 的 2.4 倍，对 Parquet 格式可达 1.5 倍。

实例映射与迁移路径¶

官方提供了从 RA3 到 RG 的明确映射关系： | 当前 RA3 实例 | 推荐的 RG 实例 | vCPU 变化 | 内存变化 | |---|---|---|---| | ra3.xlplus | rg.xlarge | — | — | | ra3.4xlarge | rg.4xlarge | 12 → 16（1.33:1） | 96 GB → 128 GB（1.33:1） | 迁移路径支持两种模式：弹性调整大小（原地迁移，10-15 分钟停机）和快照恢复（从 RA3 快照创建 RG 集群）。这种设计降低了从既有 RA3 集群迁移的机会成本。

代理式 AI 工作负载的针对性优化¶

文章特别提及人工智能代理驱动的查询规模将远超人类典型用量，导致运营成本螺旋上升。RG 实例在 2026 年 3 月已将新查询速度提升最多 7 倍，结合本次发布的 Graviton 性价比优势，直接回应了这一痛点。近实时分析应用、BI 控制面板、ETL 管线、自主 AI 代理都被明确列为目标场景。

实践启示¶

对于已有 RA3 部署的用户¶

如果当前运行的是 ra3.4xlarge 及以上规格，迁移到同等映射的 RG 实例在性价比上有明确收益。建议使用 AWS 定价计算器估算具体节省金额，并验证查询性能基准。迁移过程中的兼容性风险较低，因为外部表和查询语法无需变更。

对于混合仓库+数据湖架构¶

原来依赖 Spectrum 进行 S3 数据湖查询的场景，应优先考虑迁移到 RG 以消除每 TB 5 美元的 Spectrum 扫描费用并降低延迟。Iceberg 格式支持是这个集成引擎的差异化优势，对已有 Iceberg 数据湖资产的团队尤其值得关注。

对于 AI 代理驱动的工作负载¶

在评估 AI 代理对 Redshift 的查询频率和成本影响时，RG 实例的性价比改善提供了一个更具成本效益的基础设施选项。结合 2026 年 3 月的 7 倍查询加速，整体代理式 AI 工作负载的持有成本有望显著下降。

区域就绪性¶

RG 实例已在全球广泛区域推出，涵盖亚太、北美、欧洲、中东和南美主要区域。中国区（北京和宁夏）尚未出现在首发列表中，有国内 AWS 需求的团队需关注后续区域扩展。