Gemma 4 模型发布 — Google DeepMind 开源权重家族在 Amazon Bedrock 上线¶

Ch11.216 Gemma 4 模型发布 — Google DeepMind 开源权重家族在 Amazon Bedrock 上线¶

📊 Level ⭐⭐ | 3.7KB | entities/gemma-4-models-amazon-bedrock-deepmind-open-weights.md

Gemma 4 模型发布 — Google DeepMind 开源权重家族在 Amazon Bedrock 上线¶

Source: 原文存档

背景¶

2026-06-15 Amazon Bedrock 上线 Gemma 4 系列。Gemma 4 由 Google DeepMind 构建、Apache 2.0 许可发布，是"智能密度（intelligence-per-parameter）"导向的开源权重家族。

模型规格¶

三个变体¶

变体	类型	参数规模	主要特点
Gemma 4 31B	Dense	30.7B	旗舰 dense 模型，Intelligence Index = 39（4B-40B 开源类中位数 15 的 2.6x）
Gemma 4 26B-A4B	MoE	总参 26B / 激活 4B	推理成本低，仅激活部分参数
Gemma 4 E2B	Compact	2.3B effective	轻量部署、边缘场景

共同能力¶

内置 reasoning mode
原生 function calling（agent workflow）
多模态输入（text + image）
35+ 语言支持（预训练覆盖 140+）
智能密度优化（intelligence-per-parameter focus）

关键基准¶

Artificial Analysis 智能指数： - Gemma 4 31B Intelligence Index = 39 - 同类（4B-40B 开源权重）中位数 = 15 - 高出中位数 2.6 倍

Bedrock 集成价值¶

数据保护¶

推理完全在 AWS 基础设施上运行
prompts 和 completions 不用于训练其他模型
内容不与第三方共享

部署灵活性¶

通过完全托管服务访问
无需 provision 基础设施
无需 hosting 模型权重
无需 operate 推理栈

应用场景¶

官方推荐使用场景： - 多模态 agent - 轻量级应用 - 文档理解 pipeline - 软件工程工作流

实践启示¶

Gemma 4 31B 是开源权重 + 智能密度 + 推理托管的最佳组合 — 在 Bedrock 上跑开源权重，规避了自托管运维负担
MoE 变体适合成本敏感场景 — 26B-A4B 总参大但激活小，推理成本接近小模型
Gemma 4 E2B 适合边缘 + 轻量应用 — 2.3B effective 参数可在资源受限环境运行
AWS Bedrock 的差异化是"开源 + 托管 + 合规" — 不是新模型能力，而是把开源模型的部署门槛降到零

上线状态¶

2026-06-15 在 Amazon Bedrock 模型目录上线
通过 Bedrock on-demand inference 访问
完整支持的 API（Converse + InvokeModel）
模型卡片与定价详见 AWS Bedrock 文档

原文链接¶

相关实体¶

→ 原文存档 - diffusiongemma：扩散式文本生成模型（google 26b moe，4× 推理加速） - MOC