跳转至

Gemma 4 模型发布 — Google DeepMind 开源权重家族在 Amazon Bedrock 上线

Ch11.216 Gemma 4 模型发布 — Google DeepMind 开源权重家族在 Amazon Bedrock 上线

📊 Level ⭐⭐ | 3.7KB | entities/gemma-4-models-amazon-bedrock-deepmind-open-weights.md

Gemma 4 模型发布 — Google DeepMind 开源权重家族在 Amazon Bedrock 上线

Source: 原文存档

背景

2026-06-15 Amazon Bedrock 上线 Gemma 4 系列。Gemma 4 由 Google DeepMind 构建、Apache 2.0 许可发布,是"智能密度(intelligence-per-parameter)"导向的开源权重家族。

模型规格

三个变体

变体 类型 参数规模 主要特点
Gemma 4 31B Dense 30.7B 旗舰 dense 模型,Intelligence Index = 39(4B-40B 开源类中位数 15 的 2.6x)
Gemma 4 26B-A4B MoE 总参 26B / 激活 4B 推理成本低,仅激活部分参数
Gemma 4 E2B Compact 2.3B effective 轻量部署、边缘场景

共同能力

  • 内置 reasoning mode
  • 原生 function calling(agent workflow)
  • 多模态输入(text + image)
  • 35+ 语言支持(预训练覆盖 140+)
  • 智能密度优化(intelligence-per-parameter focus)

关键基准

Artificial Analysis 智能指数: - Gemma 4 31B Intelligence Index = 39 - 同类(4B-40B 开源权重)中位数 = 15 - 高出中位数 2.6 倍

Bedrock 集成价值

数据保护

  • 推理完全在 AWS 基础设施上运行
  • prompts 和 completions 不用于训练其他模型
  • 内容不与第三方共享

部署灵活性

  • 通过完全托管服务访问
  • 无需 provision 基础设施
  • 无需 hosting 模型权重
  • 无需 operate 推理栈

应用场景

官方推荐使用场景: - 多模态 agent - 轻量级应用 - 文档理解 pipeline - 软件工程工作流

实践启示

  • Gemma 4 31B 是开源权重 + 智能密度 + 推理托管 的最佳组合 — 在 Bedrock 上跑开源权重,规避了自托管运维负担
  • MoE 变体适合成本敏感场景 — 26B-A4B 总参大但激活小,推理成本接近小模型
  • Gemma 4 E2B 适合边缘 + 轻量应用 — 2.3B effective 参数可在资源受限环境运行
  • AWS Bedrock 的差异化是"开源 + 托管 + 合规" — 不是新模型能力,而是把开源模型的部署门槛降到零

上线状态

  • 2026-06-15 在 Amazon Bedrock 模型目录上线
  • 通过 Bedrock on-demand inference 访问
  • 完整支持的 API(Converse + InvokeModel)
  • 模型卡片与定价详见 AWS Bedrock 文档

原文链接

相关实体

原文存档 - diffusiongemma:扩散式文本生成模型(google 26b moe,4× 推理加速) - MOC