Mistral AI 发布 Mistral Medium 3.5,将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型,SWE-Bench Verified 得分 77.6%,仅需 4 块 GPU 即可部署,支持商业使用。
📝 详细摘要
文章介绍了 Mistral AI 最新开源的 Mistral Medium 3.5 模型,这是其首次将指令遵循(Medium 3.1)、推理(Magistral)和编码(Devstral 2)三条独立模型线统一为单一 128B 稠密模型。该模型在 SWE-Bench Verified 上取得 77.6% 的得分,超越了 Devstral 2 和 Qwen3.5 397B,达到开源编码最强水平。模型支持 256K 上下文窗口、多模态输入和多语言,采用修改版 MIT 许可证支持商业使用。文章还提供了详细的部署指南,包括 vLLM、SGLang、Ollama 等多种部署方式,以及 API 调用示例和推荐参数配置。核心亮点在于三模型合一的设计理念,使得开发者无需根据任务类型在不同模型间路由,通过 reasoning_effort 参数即可调整推理强度,大幅简化了部署和调优流程。
💡 主要观点
- Mistral Medium 3.5 将指令遵循、推理和编码三大能力统一于单一模型。 通过三模型合一的设计,开发者无需根据任务类型在不同模型间路由,一个权重文件即可覆盖全部场景,通过 reasoning_effort 参数按需调整推理强度。
💬 文章金句
- Mistral Medium 3.5 首次将指令遵循、推理和编码三大能力统一于单一 128B 稠密模型。
- SWE-Bench Verified 77.6%,超越 Devstral 2 和 Qwen3.5 397B。
- 稠密架构最少 4 块 GPU(80GB+ 显存)即可运行。
📊 文章信息
AI 初评:86
来源:魔搭ModelScope社区
作者:魔搭ModelScope社区
分类:人工智能
语言:中文
阅读时间:6 分钟
字数:1447
标签: Mistral Medium 3.5, 开源模型, 大语言模型, 编码能力, 模型部署