← 回總覽

Mistral Medium 3.5 开源:一套权重搞定编码、推理和指令遵循,4 块 GPU 即可部署

📅 2026-05-06 17:55 魔搭ModelScope社区 人工智能 2 分鐘 1463 字 評分: 86
Mistral Medium 3.5 开源模型 大语言模型 编码能力 模型部署
📌 一句话摘要 Mistral AI 发布 Mistral Medium 3.5,将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型,SWE-Bench Verified 得分 77.6%,仅需 4 块 GPU 即可部署,支持商业使用。 📝 详细摘要 文章介绍了 Mistral AI 最新开源的 Mistral Medium 3.5 模型,这是其首次将指令遵循(Medium 3.1)、推理(Magistral)和编码(Devstral 2)三条独立模型线统一为单一 128B 稠密模型。该模型在 SWE-Bench Verified 上取得 77.6% 的得分,超越了 Devstr

📌 一句话摘要

Mistral AI 发布 Mistral Medium 3.5,将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型,SWE-Bench Verified 得分 77.6%,仅需 4 块 GPU 即可部署,支持商业使用。

📝 详细摘要

文章介绍了 Mistral AI 最新开源的 Mistral Medium 3.5 模型,这是其首次将指令遵循(Medium 3.1)、推理(Magistral)和编码(Devstral 2)三条独立模型线统一为单一 128B 稠密模型。该模型在 SWE-Bench Verified 上取得 77.6% 的得分,超越了 Devstral 2 和 Qwen3.5 397B,达到开源编码最强水平。模型支持 256K 上下文窗口、多模态输入和多语言,采用修改版 MIT 许可证支持商业使用。文章还提供了详细的部署指南,包括 vLLM、SGLang、Ollama 等多种部署方式,以及 API 调用示例和推荐参数配置。核心亮点在于三模型合一的设计理念,使得开发者无需根据任务类型在不同模型间路由,通过 reasoning_effort 参数即可调整推理强度,大幅简化了部署和调优流程。

💡 主要观点

- Mistral Medium 3.5 将指令遵循、推理和编码三大能力统一于单一模型。 通过三模型合一的设计,开发者无需根据任务类型在不同模型间路由,一个权重文件即可覆盖全部场景,通过 reasoning_effort 参数按需调整推理强度。

SWE-Bench Verified 得分 77.6%,达到开源编码最强水平。 该得分超越了 Devstral 2(72.2%)和 Qwen3.5 397B,已替代 Devstral 2 成为 Vibe CLI 默认模型,证明了其在真实软件工程任务中的领先能力。
稠密架构降低了部署门槛,4 块 GPU 即可运行。 128B 稠密模型最少仅需 4 块 80GB+ 显存的 GPU 即可自部署,配合 EAGLE 模型可进一步加速,为开发者提供了高性价比的全能基座选择。

💬 文章金句

- Mistral Medium 3.5 首次将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型。

  • SWE-Bench Verified 77.6%,超越 Devstral 2 和 Qwen3.5 397B。
  • 稠密架构最少 4 块 GPU(80GB+ 显存)即可运行。

📊 文章信息

AI 初评:86

来源:魔搭ModelScope社区

作者:魔搭ModelScope社区

分类:人工智能

语言:中文

阅读时间:6 分钟

字数:1447

标签: Mistral Medium 3.5, 开源模型, 大语言模型, 编码能力, 模型部署

阅读完整文章

查看原文 → 發佈: 2026-05-06 17:55:00 收錄: 2026-05-07 00:00:57

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。