阶跃开源 Step 3.7 Flash：面向生产级 Agent 的高效率 Flash 模型

📌 一句话摘要

阶跃星辰发布并开源 Step 3.7 Flash 模型，这是一款面向生产级 Agent 的高效率多模态模型，采用 196B MoE 架构，激活参数仅 11B，最高生成速度达 400 Tokens/s，并具备原生多模态理解与高可靠工具调用能力。

📝 详细摘要

阶跃星辰正式发布并开源 Step 3.7 Flash 模型，该模型专为生产级 Agent 场景设计。核心特性包括：采用 196B 总参数 + 1.8B ViT 的稀疏 MoE 架构，激活参数仅 11B，实现了模型能力与推理效率的平衡；最高生成速度达 400 Tokens/s，适合高频、多轮 Agent 应用；具备原生多模态理解能力，可处理 UI、图表、文档等复杂视觉输入；强化了联网搜索与视觉搜索能力；在工具调用方面表现出色，支持 API、浏览器、终端等外部系统的高可靠调用与编排。模型已适配 Claude Code、OpenClaw、Hermes Agent 等主流 Agent 框架，支持 MCP/Skills 协议，并已上架魔搭社区。文章还提供了详细的部署指南，包括 API 调用、vLLM、SGLang、llama.cpp 和 Transformers 等多种部署方式。

💡 主要观点

- Step 3.7 Flash 采用 196B MoE 架构，激活参数仅 11B，实现高效推理。 通过稀疏 MoE 架构，模型在保持 196B 总参数容量的同时，每次推理仅激活 11B 参数，最高生成速度达 400 Tokens/s，在能力与效率间取得平衡。

模型面向生产级 Agent 场景进行了系统优化，包括多模态理解、搜索增强和工具调用。 模型具备原生多模态理解能力，可处理 UI、图表等复杂视觉信息；强化了联网与视觉搜索，支持跨文本与图像的多源证据交叉比对；在多轮 Agent 工作流中能稳定调用 API、浏览器、终端等外部系统。

模型已适配主流 Agent 框架和工具调用协议，降低了接入成本。 Step 3.7 Flash 已兼容 Claude Code、OpenClaw、Hermes Agent 等框架，支持 MCP/Skills 协议，并提供多种部署方式（vLLM、SGLang、llama.cpp 等），方便开发者快速集成。

💬 文章金句

- 下一阶段的模型竞争，不只是峰值智能，而是可规模化的高效智能。

随着 Agent 从 Demo 走向真实生产环境，模型不只要回答问题，更要理解复杂输入、主动搜索信息、稳定调用工具，并在多轮任务中持续保持执行轨迹。
Step 3.7 Flash 采用稀疏 MoE 架构，总参数 196B+1.8B（ViT）、激活参数仅 11B ，在模型能力、推理成本与执行效率之间实现更优平衡。

📊 文章信息

AI 初评：86

来源：魔搭ModelScope社区

作者：魔搭ModelScope社区

分类：人工智能

语言：中文

阅读时间：10 分钟

字数：2382

标签：阶跃星辰, Step 3.7 Flash, MoE, 多模态, Agent

阅读完整文章

阶跃开源 Step 3.7 Flash：面向生产级 Agent 的高效率 Flash 模型

🤖 問 AI