← 回總覽

全网猜了一周 DeepSeek V4,结果是小米干的

📅 2026-03-20 00:12 莫崇宇 人工智能 2 分鐘 1614 字 評分: 85
小米 MiMo 大语言模型 AI Agent 多模态 混合注意力架构
📌 一句话摘要 小米正式揭晓此前在 OpenRouter 霸榜的匿名模型为 MiMo-V2 系列,并发布了涵盖文本、全模态及语音合成的三款大模型,旨在通过极具竞争力的价格和 Agent 导向架构打通其“人车家全生态”。 📝 详细摘要 文章报道了小米 MiMo 大模型团队揭秘此前引起全网猜测的匿名模型“Hunter/Healer Alpha”实为 MiMo-V2 的内测版。小米此次发布了三款核心模型:MiMo-V2-Pro(旗舰文本基座,1T 参数,主打推理与 Agent 规划)、MiMo-V2-Omni(全模态感知与执行基座)以及 MiMo-V2-TTS(高质量语音合成)。技术上,MiMo

📌 一句话摘要

小米正式揭晓此前在 OpenRouter 霸榜的匿名模型为 MiMo-V2 系列,并发布了涵盖文本、全模态及语音合成的三款大模型,旨在通过极具竞争力的价格和 Agent 导向架构打通其“人车家全生态”。

📝 详细摘要

文章报道了小米 MiMo 大模型团队揭秘此前引起全网猜测的匿名模型“Hunter/Healer Alpha”实为 MiMo-V2 的内测版。小米此次发布了三款核心模型:MiMo-V2-Pro(旗舰文本基座,1T 参数,主打推理与 Agent 规划)、MiMo-V2-Omni(全模态感知与执行基座)以及 MiMo-V2-TTS(高质量语音合成)。技术上,MiMo-V2 采用了创新的混合注意力架构(7:1 比例)和 MTP 技术,支持 1M 超长上下文,在推理效率与长文本处理上具有显著优势。在性能表现上,该系列模型在 Artificial Analysis 等国际榜单中位居前列,且 API 定价仅为竞品的五分之一。文章强调,小米正通过这些模型将 AI 范式从“对话”转向“任务执行(Agent)”,并深度集成至其“人车家全生态”战略中,作为连接手机、汽车与智能家居的智能中枢。

💡 主要观点

- 小米 MiMo-V2 系列模型通过匿名内测展示了极强的竞争力,一度被误认为 DeepSeek V4。 匿名模型 Hunter Alpha 在 OpenRouter 调用量破 1T tokens 并多次登顶,其背后负责人为 DeepSeek 前研究员,体现了模型在代码和推理能力上的顶尖水平。

MiMo-V2-Pro 采用 1T 参数规模与混合注意力架构,实现了高性能与低延迟的平衡。 通过 7:1 的混合注意力比例及轻量 MTP 层,模型在扩大参数量的同时提升了推理效率,并支持 1M 超长上下文,为复杂 Agent 任务提供结构性优势。
小米大模型战略全面转向 Agent 范式,强调从“会对话”向“能完成任务”进化。 发布的三款模型分别负责推理规划、多模态感知与语音表达,共同构成了能自主操控浏览器、处理复杂办公文档及跨设备执行任务的完整能力栈。
极具攻击性的定价策略旨在快速渗透开发者生态,降低 AI 应用构建成本。 API 价格仅为同级别竞品的五分之一,配合与多个主流 Agent 框架的限免合作,展示了小米通过价格优势争夺开发者市场份额的野心。
MiMo 大模型是打通小米“人车家全生态”的关键智能中枢,实现系统级意图理解。 模型通过澎湃 OS 深度集成,将 AI 能力嵌入手机、汽车和智能家居,使其具备跨设备的自主规划与执行能力,完成了生态闭环的最后一步。

💬 文章金句

- 让 AI 从‘会对话’进化为‘能完成任务’。

  • MiMo-V2-Pro 的 API 价格仅为同级别竞品的 1/5。
  • 音频理解是 MiMo-V2-Omni 最具差异化的能力之一……综合表现超越 Gemini 3 Pro。
  • MiMo 团队中,明天对话次数少于 100 次的成员可以辞职。
  • AI,才是真正打通人车家全生态的那根线。

📊 文章信息

AI 评分:85

来源:爱范儿

作者:莫崇宇

分类:人工智能

语言:中文

阅读时间:13 分钟

字数:3224

标签: 小米 MiMo, 大语言模型, AI Agent, 多模态, 混合注意力架构

阅读完整文章

查看原文 → 發佈: 2026-03-20 00:12:42 收錄: 2026-03-19 18:00:19

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。