实测 MiniMax M2.7：AI 狠起来，连自己都卷

📌 一句话摘要

MiniMax 发布 M2.7 模型，主打 AI 自我进化与最强 Cowork Agent 能力，在代码推理、办公协作及自主迭代 Agent 基础设施方面表现出色。

📝 详细摘要

本文对 MiniMax 最新发布的 M2.7 模型进行了深度实测。该模型定位为「最强 Cowork Agent 模型」，核心亮点在于「自我进化」能力，即能够深度参与自身的迭代，自主优化 Agent Harness（智能体脚手架）。在技术层面，M2.7 具备 SRE 级别的系统推理能力，在 SWE-Pro 和 Kaggle MLE Lite 等硬核榜单中表现优异，得牌率直逼 Claude Opus 和 GPT-5。实测显示，它在处理复杂的 Office 任务、多 Agent 协作以及长流程数据分析（如 Kaggle 股票数据处理）中展现了极高的指令遵循度和交付质量。文章认为，M2.7 的出现标志着 AI 开始从「被动工具」向「理解并优化工作流的自主实体」转变。

💡 主要观点

- MiniMax M2.7 实现了从「辅助迭代」到「深度参与自我迭代」的跨越。 模型能够自主分析失败轨迹并规划改动，通过超过 100 轮的零人工干预循环，自主优化 Agent 运行基础设施，使评测效果提升 30%。

具备 SRE 级别的系统推理能力，显著提升了代码修复与运维效率。 模型能理解系统运行时的底层逻辑，通过看日志、关联时间线推断根因，在 SWE-Pro 评测中表现接近 Claude Opus 4.6。

针对多 Agent 协作场景进行了专项打磨，保证了复杂环境下的指令遵循。 在包含 50 个以上 Skills 的复杂环境中，M2.7 能保持清晰的角色边界和极高的指令遵循能力，确保长流程任务不断联。

在专业知识交付与办公场景中展现出极高的实用价值。 模型在金融分析、Office 三件套复杂编辑等场景表现优异，其 GDPval-AA 评测得分位居国产模型首位，具备极强的任务交付能力。

💬 文章金句

- 模型更需要懂得 AI 的工作方式和工作流，还得学会自己优化自己。

MiniMax M2.7 是他们第一个深度参与迭代自己的模型，不只是『辅助迭代』，是『深度参与迭代自己』。
当一个模型能够在没有人工编码的情况下，自己搭系统、自己测试、自己回退——『AI 研发』这件事的齿轮，某种程度上已经换上了自动挡。
让 AI 真正理解工作流，并且参与到工作流的演化里。
所谓『龙虾到底该怎么用』，我想很快就不再是一个问题——因为决定这一切的，不再是我们，而是那个开始学会自己工作的 AI。

📊 文章信息

AI 评分：79

来源：爱范儿

作者：张子豪

分类：人工智能

语言：中文

阅读时间：15 分钟

字数：3701

标签： MiniMax M2.7, AI Agent, 自我进化, 代码推理, OpenClaw

阅读完整文章

实测 MiniMax M2.7：AI 狠起来，连自己都卷

🤖 問 AI