Token 效率国内第一！MiMo-V2.5 Pro 登顶开源 Agent 王者；罗福莉：OpenClaw 是巨大分水岭，模型与 Harness 需同步演进，MLA 不符合 Agent 范式

📌 一句话摘要

本文报道了小米开源最强 Agent 模型 MiMo-V2.5 系列，并深度整理了其负责人罗福莉关于 Agent 框架、持久化记忆、自学习路径及 MLA 架构局限性的最新技术见解。

📝 详细摘要

文章分为两大核心部分。第一部分报道了小米凌晨开源 MiMo-V2.5 系列模型，包括专为复杂 Agent 任务设计的 MiMo-V2.5-Pro（1.02T 参数，42B 激活）和原生全模态模型 MiMo-V2.5（310B 参数，15B 激活）。该系列在 GDPVal-AA、ClawEval 和 τ³-Bench 等 Agent 基准测试中登顶开源榜首，Token 效率比 Kimi K2.6 节省 42%，并采用 MIT 协议开源。第二部分深度整理了小米 MiMo 负责人罗福莉的首次长时间技术访谈。她分享了使用 OpenClaw 的三次认知转变，认为其核心优势在于精细编排的上下文、持久化记忆系统和多模型协同利用。她提出，一个好的 Agent 框架必须具备持久化记忆，模型与 Agent 框架需同步演进以实现自学习。她还尖锐地指出，MLA（多头潜在注意力机制）不符合 Agent 范式，因其在计算受限下难以结合 MTP（多 Token 预测），并介绍了团队通过极致混合注意力层比例（全量:滑动窗口=7:1）来平衡访存与计算、支持长上下文的架构创新。

💡 主要观点

- 小米开源 MiMo-V2.5 系列模型，Agent 能力登顶开源榜首。 MiMo-V2.5-Pro 在多个 Agent 基准测试中超越 DeepSeek V4-Pro、Kimi K2.6 等模型，Token 效率提升 42%，采用 MIT 协议开源，支持 1M 上下文窗口。

罗福莉认为 OpenClaw 是 AI 技术进化的分水岭，其核心优势在于精细编排的上下文和持久化记忆。 她经历了从认为 OpenClaw 只是有灵魂的产品，到能分担工作，再到推动研究的认知转变。其优势在于通过精细的上下文编排和多模型协同来弥补模型短板，持久化记忆系统是实现跨会话上下文共享的关键。

Agent 的“自学习”需要模型与 Agent 框架同步演进。 随着模型能力提升，Agent 框架的静态信息（如记忆、Skill）和动态架构设计也需要随之改变，以提升适配度和泛化能力。

罗福莉指出 MLA 机制不符合 Agent 范式，并分享了团队的架构创新。 MLA 在计算受限下难以结合 MTP 进行推理加速。小米团队通过将全量注意力与滑动窗口层的比例推至 7:1，节省 KV Cache，从而在长文本处理中平衡访存与计算，并支持 MTP。

💬 文章金句

- OpenCLaw 的使用是 AI 技术进化的一个巨大分水岭。

原始且复杂的 Agent 框架设计确实能弥补很多模型能力的不足。
Agent 框架了解模型能力的优缺点，知道如何更好地调度。这一人与模型之间的中间层可以做得非常厚，而前端 UI 成为最薄的一层。
MLA 的原始设计是为了在当时的 H 系列芯片上实现更好的访存计算比，从而打破访存瓶颈。在这种结构下设计的模型架构，几乎没有发挥空间。
我们将混合比例推向了极致，全量注意力和滑动窗口层的比例达到了极端的 7:1。

📊 文章信息

AI 初评：88

来源：51CTO技术栈

作者：51CTO技术栈

分类：人工智能

语言：中文

阅读时间：16 分钟

字数：3830

标签： MiMo-V2.5, 小米, 罗福莉, Agent, 开源模型

阅读完整文章

Token 效率国内第一！MiMo-V2.5 Pro 登顶开源 Agent 王者；罗福莉：OpenClaw 是巨大分水岭，模型与 Harness 需同步演进，MLA 不符合 Agent 范式

🤖 問 AI