[AI 新闻] MiniMax 2.7：以 1/3 的成本实现 GLM-5 级别的 SOTA 开源模型

📌 一句话摘要

MiniMax 2.7 作为一款具备“自我进化”能力的高效 SOTA 开源模型发布，同时在智能体（Agent）架构工程、混合 SSM 架构以及多模态文档 AI 领域带来了重大更新。

📝 详细摘要

本期 AI 新闻重点介绍了 MiniMax 2.7 的发布，该模型以 1/3 的成本实现了媲美 GLM-5 的 SOTA 性能，并强调了其“自我进化”的训练过程，模型参与了自身 30%-50% 的开发工作流。报告涵盖了小米的 MiMo-V2-Pro 推理模型以及 Mamba-3 的引入，这标志着行业正转向混合 Transformer-SSM 架构以提升推理效率。行业的一个主要趋势是 AI 智能体的演进，正从简单的提示词工程转向复杂的“架构工程”（harness engineering）和标准化的“技能”抽象。技术深度解析包括 Moonshot（月之暗面）用于模型与基础设施协同设计的 Attention Residual 架构，以及 Qianfan-OCR 等多模态 OCR 模型的进展。行业动态部分还提到了 OpenAI 价值 100 万美元的“参数高尔夫”（Parameter Golf）训练挑战，以及 Runway 在实时视频生成领域取得的突破，实现了低于 100 毫秒的延迟。

💡 主要观点

- MiniMax 2.7 以 1/3 的成本匹配 SOTA 性能，树立了效率新标杆。 通过以极低的 Token 成本实现与 GLM-5 等模型相当的性能，MiniMax 2.7 证明了训练中的优化和“自我进化”可以显著降低部署高智能模型的门槛。

行业正在将 AI 智能体的重心从“提示词工程”转向“架构工程”。 智能体性能的瓶颈正从基础模型能力转移到周围的执行环境，包括工具、代码库可读性、约束条件以及定义智能体运行架构的反馈循环。

像 Mamba-3 这样的混合架构正成为提升推理效率的首选路径。 趋势不再是单一的 SSM，而是将 Mamba-3 集成到 Transformer 混合架构中，以替代 Gated DeltaNet 等组件，旨在为下一代生产模型平衡两种架构的优势。

模型与基础设施的协同设计对于扩展生产级大模型至关重要。 像 Attention Residual 这样的架构需要与推理基础设施深度集成，利用 Block Attention Residual 和跨阶段缓存等技术来管理流水线并行中的内存和通信瓶颈。

预训练数据构成正重新成为提升模型性能的主要杠杆。 最新研究表明，在预训练期间混合 SFT（监督微调）数据或多次重复高质量数据集，其效果可能优于标准的微调流水线，为领域适应提供了一条更有效的途径。

💬 文章金句

- MiniMax 2.7 是本次发布的重头戏……这是其首个‘深度参与自身进化’的模型。

最强烈的反复出现的主题是，架构工程正在成为真正的差异化因素。
技能正在固化为跨智能体技术栈的共享抽象。
上下文工程正在成为提示词工程的继任者，结构化解析/提取是其核心杠杆。
Runway 分享了一个研究预览……展示了首帧生成时间低于 100 毫秒的高清视频生成能力。

📊 文章信息

AI 评分：82

来源：Latent Space

作者：Latent.Space

分类：人工智能

语言：英文

阅读时间：9 分钟

字数：2177

标签： MiniMax 2.7, LLM 效率, AI 智能体, Mamba-3, 自我进化 AI

阅读完整文章

[AI 新闻] MiniMax 2.7：以 1/3 的成本实现 GLM-5 级别的 SOTA 开源模型

🤖 問 AI