Mistral Medium 3.5 开源：一套权重搞定编码、推理和指令遵循，4 块 GPU 即可部署

📌 一句话摘要

Mistral AI 发布 Mistral Medium 3.5，将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型，SWE-Bench Verified 得分 77.6%，仅需 4 块 GPU 即可部署，支持商业使用。

📝 详细摘要

文章介绍了 Mistral AI 最新开源的 Mistral Medium 3.5 模型，这是其首次将指令遵循（Medium 3.1）、推理（Magistral）和编码（Devstral 2）三条独立模型线统一为单一 128B 稠密模型。该模型在 SWE-Bench Verified 上取得 77.6% 的得分，超越了 Devstral 2 和 Qwen3.5 397B，达到开源编码最强水平。模型支持 256K 上下文窗口、多模态输入和多语言，采用修改版 MIT 许可证支持商业使用。文章还提供了详细的部署指南，包括 vLLM、SGLang、Ollama 等多种部署方式，以及 API 调用示例和推荐参数配置。核心亮点在于三模型合一的设计理念，使得开发者无需根据任务类型在不同模型间路由，通过 reasoning_effort 参数即可调整推理强度，大幅简化了部署和调优流程。

💡 主要观点

- Mistral Medium 3.5 将指令遵循、推理和编码三大能力统一于单一模型。 通过三模型合一的设计，开发者无需根据任务类型在不同模型间路由，一个权重文件即可覆盖全部场景，通过 reasoning_effort 参数按需调整推理强度。

SWE-Bench Verified 得分 77.6%，达到开源编码最强水平。 该得分超越了 Devstral 2（72.2%）和 Qwen3.5 397B，已替代 Devstral 2 成为 Vibe CLI 默认模型，证明了其在真实软件工程任务中的领先能力。

稠密架构降低了部署门槛，4 块 GPU 即可运行。 128B 稠密模型最少仅需 4 块 80GB+ 显存的 GPU 即可自部署，配合 EAGLE 模型可进一步加速，为开发者提供了高性价比的全能基座选择。

💬 文章金句

- Mistral Medium 3.5 首次将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型。

SWE-Bench Verified 77.6%，超越 Devstral 2 和 Qwen3.5 397B。
稠密架构最少 4 块 GPU（80GB+ 显存）即可运行。

📊 文章信息

AI 初评：86

来源：魔搭ModelScope社区

作者：魔搭ModelScope社区

分类：人工智能

语言：中文

阅读时间：6 分钟

字数：1447

标签： Mistral Medium 3.5, 开源模型, 大语言模型, 编码能力, 模型部署

阅读完整文章

Mistral Medium 3.5 开源：一套权重搞定编码、推理和指令遵循，4 块 GPU 即可部署

🤖 問 AI