← 回總覽

实测 MiniMax M2.7:AI 狠起来,连自己都卷

📅 2026-03-20 19:13 张子豪 人工智能 2 分鐘 1425 字 評分: 79
MiniMax M2.7 AI Agent 自我进化 代码推理 OpenClaw
📌 一句话摘要 MiniMax 发布 M2.7 模型,主打 AI 自我进化与最强 Cowork Agent 能力,在代码推理、办公协作及自主迭代 Agent 基础设施方面表现出色。 📝 详细摘要 本文对 MiniMax 最新发布的 M2.7 模型进行了深度实测。该模型定位为「最强 Cowork Agent 模型」,核心亮点在于「自我进化」能力,即能够深度参与自身的迭代,自主优化 Agent Harness(智能体脚手架)。在技术层面,M2.7 具备 SRE 级别的系统推理能力,在 SWE-Pro 和 Kaggle MLE Lite 等硬核榜单中表现优异,得牌率直逼 Claude Opus

📌 一句话摘要

MiniMax 发布 M2.7 模型,主打 AI 自我进化与最强 Cowork Agent 能力,在代码推理、办公协作及自主迭代 Agent 基础设施方面表现出色。

📝 详细摘要

本文对 MiniMax 最新发布的 M2.7 模型进行了深度实测。该模型定位为「最强 Cowork Agent 模型」,核心亮点在于「自我进化」能力,即能够深度参与自身的迭代,自主优化 Agent Harness(智能体脚手架)。在技术层面,M2.7 具备 SRE 级别的系统推理能力,在 SWE-Pro 和 Kaggle MLE Lite 等硬核榜单中表现优异,得牌率直逼 Claude Opus 和 GPT-5。实测显示,它在处理复杂的 Office 任务、多 Agent 协作以及长流程数据分析(如 Kaggle 股票数据处理)中展现了极高的指令遵循度和交付质量。文章认为,M2.7 的出现标志着 AI 开始从「被动工具」向「理解并优化工作流的自主实体」转变。

💡 主要观点

- MiniMax M2.7 实现了从「辅助迭代」到「深度参与自我迭代」的跨越。 模型能够自主分析失败轨迹并规划改动,通过超过 100 轮的零人工干预循环,自主优化 Agent 运行基础设施,使评测效果提升 30%。

具备 SRE 级别的系统推理能力,显著提升了代码修复与运维效率。 模型能理解系统运行时的底层逻辑,通过看日志、关联时间线推断根因,在 SWE-Pro 评测中表现接近 Claude Opus 4.6。
针对多 Agent 协作场景进行了专项打磨,保证了复杂环境下的指令遵循。 在包含 50 个以上 Skills 的复杂环境中,M2.7 能保持清晰的角色边界和极高的指令遵循能力,确保长流程任务不断联。
在专业知识交付与办公场景中展现出极高的实用价值。 模型在金融分析、Office 三件套复杂编辑等场景表现优异,其 GDPval-AA 评测得分位居国产模型首位,具备极强的任务交付能力。

💬 文章金句

- 模型更需要懂得 AI 的工作方式和工作流,还得学会自己优化自己。

  • MiniMax M2.7 是他们第一个深度参与迭代自己的模型,不只是『辅助迭代』,是『深度参与迭代自己』。
  • 当一个模型能够在没有人工编码的情况下,自己搭系统、自己测试、自己回退——『AI 研发』这件事的齿轮,某种程度上已经换上了自动挡。
  • 让 AI 真正理解工作流,并且参与到工作流的演化里。
  • 所谓『龙虾到底该怎么用』,我想很快就不再是一个问题——因为决定这一切的,不再是我们,而是那个开始学会自己工作的 AI。

📊 文章信息

AI 评分:79

来源:爱范儿

作者:张子豪

分类:人工智能

语言:中文

阅读时间:15 分钟

字数:3701

标签: MiniMax M2.7, AI Agent, 自我进化, 代码推理, OpenClaw

阅读完整文章

查看原文 → 發佈: 2026-03-20 19:13:03 收錄: 2026-03-20 14:00:51

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。