← 回總覽

Token 效率国内第一!MiMo-V2.5 Pro 登顶开源 Agent 王者;罗福莉:OpenClaw 是巨大分水岭,模型与 Harness 需同步演进,MLA 不符合 Agent 范式

📅 2026-04-28 16:54 51CTO技术栈 人工智能 2 分鐘 1770 字 評分: 88
MiMo-V2.5 小米 罗福莉 Agent 开源模型
📌 一句话摘要 本文报道了小米开源最强 Agent 模型 MiMo-V2.5 系列,并深度整理了其负责人罗福莉关于 Agent 框架、持久化记忆、自学习路径及 MLA 架构局限性的最新技术见解。 📝 详细摘要 文章分为两大核心部分。第一部分报道了小米凌晨开源 MiMo-V2.5 系列模型,包括专为复杂 Agent 任务设计的 MiMo-V2.5-Pro(1.02T 参数,42B 激活)和原生全模态模型 MiMo-V2.5(310B 参数,15B 激活)。该系列在 GDPVal-AA、ClawEval 和 τ³-Bench 等 Agent 基准测试中登顶开源榜首,Token 效率比 Kimi

📌 一句话摘要

本文报道了小米开源最强 Agent 模型 MiMo-V2.5 系列,并深度整理了其负责人罗福莉关于 Agent 框架、持久化记忆、自学习路径及 MLA 架构局限性的最新技术见解。

📝 详细摘要

文章分为两大核心部分。第一部分报道了小米凌晨开源 MiMo-V2.5 系列模型,包括专为复杂 Agent 任务设计的 MiMo-V2.5-Pro(1.02T 参数,42B 激活)和原生全模态模型 MiMo-V2.5(310B 参数,15B 激活)。该系列在 GDPVal-AA、ClawEval 和 τ³-Bench 等 Agent 基准测试中登顶开源榜首,Token 效率比 Kimi K2.6 节省 42%,并采用 MIT 协议开源。第二部分深度整理了小米 MiMo 负责人罗福莉的首次长时间技术访谈。她分享了使用 OpenClaw 的三次认知转变,认为其核心优势在于精细编排的上下文、持久化记忆系统和多模型协同利用。她提出,一个好的 Agent 框架必须具备持久化记忆,模型与 Agent 框架需同步演进以实现自学习。她还尖锐地指出,MLA(多头潜在注意力机制)不符合 Agent 范式,因其在计算受限下难以结合 MTP(多 Token 预测),并介绍了团队通过极致混合注意力层比例(全量:滑动窗口=7:1)来平衡访存与计算、支持长上下文的架构创新。

💡 主要观点

- 小米开源 MiMo-V2.5 系列模型,Agent 能力登顶开源榜首。 MiMo-V2.5-Pro 在多个 Agent 基准测试中超越 DeepSeek V4-Pro、Kimi K2.6 等模型,Token 效率提升 42%,采用 MIT 协议开源,支持 1M 上下文窗口。

罗福莉认为 OpenClaw 是 AI 技术进化的分水岭,其核心优势在于精细编排的上下文和持久化记忆。 她经历了从认为 OpenClaw 只是有灵魂的产品,到能分担工作,再到推动研究的认知转变。其优势在于通过精细的上下文编排和多模型协同来弥补模型短板,持久化记忆系统是实现跨会话上下文共享的关键。
Agent 的“自学习”需要模型与 Agent 框架同步演进。 随着模型能力提升,Agent 框架的静态信息(如记忆、Skill)和动态架构设计也需要随之改变,以提升适配度和泛化能力。
罗福莉指出 MLA 机制不符合 Agent 范式,并分享了团队的架构创新。 MLA 在计算受限下难以结合 MTP 进行推理加速。小米团队通过将全量注意力与滑动窗口层的比例推至 7:1,节省 KV Cache,从而在长文本处理中平衡访存与计算,并支持 MTP。

💬 文章金句

- OpenCLaw 的使用是 AI 技术进化的一个巨大分水岭。

  • 原始且复杂的 Agent 框架设计确实能弥补很多模型能力的不足。
  • Agent 框架了解模型能力的优缺点,知道如何更好地调度。这一人与模型之间的中间层可以做得非常厚,而前端 UI 成为最薄的一层。
  • MLA 的原始设计是为了在当时的 H 系列芯片上实现更好的访存计算比,从而打破访存瓶颈。在这种结构下设计的模型架构,几乎没有发挥空间。
  • 我们将混合比例推向了极致,全量注意力和滑动窗口层的比例达到了极端的 7:1。

📊 文章信息

AI 初评:88

来源:51CTO技术栈

作者:51CTO技术栈

分类:人工智能

语言:中文

阅读时间:16 分钟

字数:3830

标签: MiMo-V2.5, 小米, 罗福莉, Agent, 开源模型

阅读完整文章

查看原文 → 發佈: 2026-04-28 16:54:00 收錄: 2026-04-28 20:00:17

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。