MiniMax M2.7 — 自我进化LLM¶

Ch01.709 MiniMax M2.7 — 自我进化LLM¶

📊 Level ⭐⭐ | 4.1KB | entities/minimax-m2-7.md

MiniMax M2.7¶

首个模型深度参与迭代自身的LLM版本，主打自我进化+Agent Teams+专业办公。

基本信息¶

发布: 2026-03-18
厂商: MiniMax稀宇科技
官方文章: https://mp.weixin.qq.com/s/Xfsq8YDP7xkOLzbh1HwdjA

核心能力¶

能力	亮点
自我进化	模型自主构建Harness并驱动RL训练，100轮迭代+30%效果提升
Agent Teams	原生多智能体协作，角色边界/对抗性推理/协议遵循内化
软件工程	SWE-Pro 56.22%追平GPT-5.3-Codex
专业办公	GDPval-AA开源最高ELO 1500，Finance建模+PPT/Word/Excel一体化
MLE Bench Lite	三次平均66.6%得牌率，与Gemini-3.1持平

Benchmark一览¶

SWE-Pro: 56.22%（追平GPT-5.3-Codex）
VIBE-Pro: 55.6%（接近Opus 4.6）
Terminal Bench 2: 57.0%
GDPval-AA ELO: 1500（开源最高）
MM-Claw: 62.7%（接近Sonnet 4.6）
MLE Bench Lite: 66.6%得牌率（Gemini-3.1水平）

自我进化¶

模型能够： 1. 自行构建复杂Agent Harness 2. 驱动模型自身的强化学习训练迭代 3. 自主迭代Harness（100轮+） 4. 发现有效优化（采样参数、工作流指引、循环检测）

深度分析¶

MiniMax M2.7代表了LLM发展的一条新路径——模型不再只是被训练的对象，而是深度参与自身迭代优化的主体。 自我进化范式的意义：传统RL训练依赖人类研究员构建Harness、设计奖励函数、诊断失败原因。M2.7将这一过程自动化——模型自行构建Harness、驱动训练迭代、发现有效优化。100轮自主迭代带来30%的内部评测提升，证明模型对自身"如何学得更好"具备实质性贡献。 Agent Teams的原生内化：传统多Agent系统通过提示词约束角色行为，但M2.7将角色边界、对抗性推理、协议遵循内化为原生能力。这意味着Agent间的协作不再依赖外部编排，而是模型自身的内在能力。 Benchmark格局：M2.7在编程（SWE-Pro 56.22%追平GPT-5.3-Codex）、专业办公（GDPval-AA ELO 1500开源最高）、Agent能力（MM-Claw 62.7%接近Sonnet 4.6）三个维度同时达到第一梯队，显示出自我进化带来的全面能力提升。

实践启示¶

ML团队：Harness Engineering正在成为新学科——如何设计让模型能自主优化训练过程的脚手架，比单纯调参更具杠杆效应
企业用户：Agent Teams适用于需要多角色协作的复杂业务流程，原生角色边界和对抗性推理可降低多Agent系统的编排复杂度
开发者：SWE-Pro 56.22%的编程能力意味着AI辅助开发进入新阶段，模型不仅能生成代码，还能自主完成调试、修复、提交的完整闭环
AI研究者：M2.7的自我进化机制展示了"模型改进模型"的可能性，100轮自主迭代+30%提升验证了这一方向的可行性

关联项目¶

OpenRoom: https://github.com/MiniMax-AI/OpenRoom — 互动娱乐Agent交互系统

与本文相关¶

Openclaw Architecture 800Lines — OpenClaw架构（MM-Claw基准基于此构建）
Edgeclaw Openbmb — EdgeClaw端云两栖（MiniCPM是端侧对比）
Gstack Ai Workflow — 并行Sprint工作流
— 企业级Agent落地对比
Hermes Agent Deep Dive — Self-Evolution概念对照
Minimax M2 7 Self Evolution — 详细官方发布（raw）