本文报道了小米开源最强 Agent 模型 MiMo-V2.5 系列,并深度整理了其负责人罗福莉关于 Agent 框架、持久化记忆、自学习路径及 MLA 架构局限性的最新技术见解。
📝 详细摘要
文章分为两大核心部分。第一部分报道了小米凌晨开源 MiMo-V2.5 系列模型,包括专为复杂 Agent 任务设计的 MiMo-V2.5-Pro(1.02T 参数,42B 激活)和原生全模态模型 MiMo-V2.5(310B 参数,15B 激活)。该系列在 GDPVal-AA、ClawEval 和 τ³-Bench 等 Agent 基准测试中登顶开源榜首,Token 效率比 Kimi K2.6 节省 42%,并采用 MIT 协议开源。第二部分深度整理了小米 MiMo 负责人罗福莉的首次长时间技术访谈。她分享了使用 OpenClaw 的三次认知转变,认为其核心优势在于精细编排的上下文、持久化记忆系统和多模型协同利用。她提出,一个好的 Agent 框架必须具备持久化记忆,模型与 Agent 框架需同步演进以实现自学习。她还尖锐地指出,MLA(多头潜在注意力机制)不符合 Agent 范式,因其在计算受限下难以结合 MTP(多 Token 预测),并介绍了团队通过极致混合注意力层比例(全量:滑动窗口=7:1)来平衡访存与计算、支持长上下文的架构创新。
💡 主要观点
- 小米开源 MiMo-V2.5 系列模型,Agent 能力登顶开源榜首。 MiMo-V2.5-Pro 在多个 Agent 基准测试中超越 DeepSeek V4-Pro、Kimi K2.6 等模型,Token 效率提升 42%,采用 MIT 协议开源,支持 1M 上下文窗口。
💬 文章金句
- OpenCLaw 的使用是 AI 技术进化的一个巨大分水岭。
- 原始且复杂的 Agent 框架设计确实能弥补很多模型能力的不足。
- Agent 框架了解模型能力的优缺点,知道如何更好地调度。这一人与模型之间的中间层可以做得非常厚,而前端 UI 成为最薄的一层。
- MLA 的原始设计是为了在当时的 H 系列芯片上实现更好的访存计算比,从而打破访存瓶颈。在这种结构下设计的模型架构,几乎没有发挥空间。
- 我们将混合比例推向了极致,全量注意力和滑动窗口层的比例达到了极端的 7:1。
📊 文章信息
AI 初评:88
来源:51CTO技术栈
作者:51CTO技术栈
分类:人工智能
语言:中文
阅读时间:16 分钟
字数:3830
标签: MiMo-V2.5, 小米, 罗福莉, Agent, 开源模型