小米 MiMo-V2.5 系列模型开源：1T 参数 MoE 与百万上下文

📅 2026-04-28 09:45 meng shao 人工智能 1 分鐘 607 字評分: 85

📌 一句话摘要小米开源 MiMo-V2.5-Pro（1T/42B MoE）和 MiMo-V2.5（310B/15B MoE）模型，支持 1M 上下文，并发布 100T Token 创造者激励计划。 📝 详细摘要这篇推文详细介绍了小米最新开源的 MiMo-V2.5 系列模型。MiMo-V2.5-Pro 采用 1T 总参数/42B 激活的 MoE 架构，支持 1M 上下文；MiMo-V2.5 为 310B/15B MoE。架构关键点包括：混合注意力（SWA 与 GA 交错）、多 Token 预测（MTP，3 层）和稀疏 MoE。后训练采用 MOPD（Multi-Teacher On-Pol

📌 一句话摘要

小米开源 MiMo-V2.5-Pro（1T/42B MoE）和 MiMo-V2.5（310B/15B MoE）模型，支持 1M 上下文，并发布 100T Token 创造者激励计划。

📝 详细摘要

这篇推文详细介绍了小米最新开源的 MiMo-V2.5 系列模型。MiMo-V2.5-Pro 采用 1T 总参数/42B 激活的 MoE 架构，支持 1M 上下文；MiMo-V2.5 为 310B/15B MoE。架构关键点包括：混合注意力（SWA 与 GA 交错）、多 Token 预测（MTP，3 层）和稀疏 MoE。后训练采用 MOPD（Multi-Teacher On-Policy Distillation）范式。同时发布了 100T Token 创造者激励计划。

📊 文章信息

AI 初评：85

来源：meng shao(@shao__meng)

作者：meng shao

分类：人工智能

语言：中文

阅读时间：5 分钟

字数：1006

标签： MiMo-V2.5, 小米, 开源模型, MoE, 百万上下文

阅读推文

查看原文 → 發佈: 2026-04-28 09:45:25 收錄: 2026-04-28 12:00:26

小米 MiMo-V2.5 系列模型开源：1T 参数 MoE 与百万上下文

🤖 問 AI