小米神操作！认领榜一神秘模型 Hunter Alpha，龙虾之父都忍不住打听

📌 一句话摘要

小米正式揭晓 OpenRouter 榜首模型 Hunter Alpha 的真实身份为万亿参数旗舰大模型 MiMo-V2-Pro，并同步发布了 Omni 全模态及 TTS 语音模型。

📝 详细摘要

文章报道了小米 AI 团队正式官宣 MiMo-V2 系列模型，揭开了此前在 OpenRouter 平台霸榜的神秘模型 Hunter Alpha（即 MiMo-V2-Pro）的真面目。该模型拥有超过 1T 的总参数量和 42B 的激活参数，支持百万级长文本，并在代码生成（SWE-bench）和智能体任务中表现卓越，综合排名位居全球前列。文章详细介绍了其采用的 7:1 混合注意力机制、MTP 多 Token 预测层，以及与北京大学联合研发的 ARL-Tangram 统一资源管理系统。此外，小米还推出了融合视听读能力的全模态模型 MiMo-V2-Omni 和支持情感控制的语音模型 MiMo-V2-TTS，展示了其在 AI 智能体全链路的布局。

💡 主要观点

- MiMo-V2-Pro 身份揭秘：确认其为此前在 OpenRouter 盲测中表现惊人的 Hunter Alpha。 该模型在匿名测试期间调用量迅速登顶，验证了其在真实生产环境（如 OpenClaw、Roo Code）中的极致可靠性与代码能力。

卓越的架构设计：采用 7:1 混合注意力机制与 MTP 多 Token 预测，兼顾万亿规模与推理效率。 模型总参数量突破 1T，通过优化混合注意力比例和多 Token 预测技术，在处理百万级长文本时仍能保持极快的生成速度。

算力优化突破：联合北大研发 ARL-Tangram 系统，大幅降低算力成本并提升训练效率。 该系统解决了异构资源约束难题，使训练持续时间缩短 1.5 倍，算力成本降低 71.2%，为万亿级模型训练提供了坚实支撑。

全模态与情感交互：同步推出的 Omni 模型实现视听读融合，TTS 模型支持自然语言控制情感。 Omni 模型将多种编码器融合进主干网络，具备自主交互能力；TTS 模型则能通过提示词精确控制音色与情绪，赋予智能体情感。

💬 文章金句

- 占领 OpenRouter 调用量榜单第一的神秘模型 Hunter Alpha，终于揭开神秘面纱——既不是 GPT，也不是 DeepSeek，而是来自小米的万亿旗舰模型 MiMo-V2-Pro。

在底层架构设计上，它继承了混合注意力机制，并且将混合比例从 5:1 大幅提升到了 7:1，兼顾了超大规模与极高的推理效率。
该系统让训练步骤的持续时间至多缩短了 1.5 倍，直接将算力成本与外部资源消耗大幅降低了 71.2%。
MiMo-V2-Omni 作为全模态模型，最大的亮点在于它把图像、视频和音频编码器融合进了一个主干网络里。
MiMo-V2-TTS 则是一个专门给智能体赋予感情的语音模型，只要直接用自然语言输入提示词，就能精确控制它的音色和情绪走向。

📊 文章信息

AI 评分：81

来源：量子位

作者：克雷西

分类：人工智能

语言：中文

阅读时间：9 分钟

字数：2079

标签：小米 MiMo-V2, 大语言模型, 混合专家模型 (MoE), 智能体 (Agent), 代码生成

阅读完整文章

小米神操作！认领榜一神秘模型 Hunter Alpha，龙虾之父都忍不住打听

🤖 問 AI