MiniMax 发布 M3 模型,集前沿 Coding 能力、1M 超长上下文和原生多模态于一体,是国内首个齐备这些要素的模型,并已开源。
📝 详细摘要
MiniMax 正式发布 M3 模型,这是国内首个同时具备前沿编程能力、1M 超长上下文和原生多模态能力的模型,也是目前唯一的开源模型。M3 在 SWE-Bench Pro、Terminal Bench 等权威评测中达到国际领先水平,Coding 能力超越 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7。其核心创新在于全新的稀疏注意力架构 MSA,在 100 万上下文下计算量仅为上代模型的 1/20,prefilling 阶段加速超 9 倍。M3 从 Step 0 开始进行多模态混合训练,支持图片和视频输入,并能操作电脑桌面。文章通过验证论文复现、CUDA 算子优化、模型自主训练等实际任务,展示了 M3 在长程复杂任务上的自主迭代能力。同时,MiniMax 还推出了专为 M3 设计的 Agent 产品 MiniMax Code 和极具性价比的 Token Plan 订阅方案。
💡 主要观点
- MiniMax M3 是国内首个集前沿 Coding、1M 上下文和原生多模态于一体的开源模型。 M3 同时具备这三个海外闭源前沿模型的核心能力,填补了国内开源模型的空白,并在多项基准测试中达到国际领先水平。
💬 文章金句
- M3 是国内第一个齐备这些要素的模型,也是目前唯一的开源模型。
- 在 100 万上下文下,M3 每 token 计算量仅为上代模型的 1/20。
- 下一代 Agent Coding 比的不仅是代码生成,更要比拼长期协作能力、规划能力以及人与 Agent 的协同效率。
- M3 把真正对 Coding 和 Agent 至关重要的数据 Scale up,目标不仅是在 Benchmark 上取得领先,更是在真实研发流程中成为开发者可靠的协作伙伴。
📊 文章信息
AI 初评:93
精选文章:是
来源:MiniMax 稀宇科技
作者:MiniMax 稀宇科技
分类:人工智能
语言:中文
阅读时间:18 分钟
字数:4251
标签: MiniMax M3, 大语言模型, 多模态, Coding, Agent