← 回總覽

阶跃开源 Step 3.7 Flash:面向生产级 Agent 的高效率 Flash 模型

📅 2026-05-29 16:00 魔搭ModelScope社区 人工智能 2 分鐘 1581 字 評分: 86
阶跃星辰 Step 3.7 Flash MoE 多模态 Agent
📌 一句话摘要 阶跃星辰发布并开源 Step 3.7 Flash 模型,这是一款面向生产级 Agent 的高效率多模态模型,采用 196B MoE 架构,激活参数仅 11B,最高生成速度达 400 Tokens/s,并具备原生多模态理解与高可靠工具调用能力。 📝 详细摘要 阶跃星辰正式发布并开源 Step 3.7 Flash 模型,该模型专为生产级 Agent 场景设计。核心特性包括:采用 196B 总参数 + 1.8B ViT 的稀疏 MoE 架构,激活参数仅 11B,实现了模型能力与推理效率的平衡;最高生成速度达 400 Tokens/s,适合高频、多轮 Agent 应用;具备原生多模

📌 一句话摘要

阶跃星辰发布并开源 Step 3.7 Flash 模型,这是一款面向生产级 Agent 的高效率多模态模型,采用 196B MoE 架构,激活参数仅 11B,最高生成速度达 400 Tokens/s,并具备原生多模态理解与高可靠工具调用能力。

📝 详细摘要

阶跃星辰正式发布并开源 Step 3.7 Flash 模型,该模型专为生产级 Agent 场景设计。核心特性包括:采用 196B 总参数 + 1.8B ViT 的稀疏 MoE 架构,激活参数仅 11B,实现了模型能力与推理效率的平衡;最高生成速度达 400 Tokens/s,适合高频、多轮 Agent 应用;具备原生多模态理解能力,可处理 UI、图表、文档等复杂视觉输入;强化了联网搜索与视觉搜索能力;在工具调用方面表现出色,支持 API、浏览器、终端等外部系统的高可靠调用与编排。模型已适配 Claude Code、OpenClaw、Hermes Agent 等主流 Agent 框架,支持 MCP/Skills 协议,并已上架魔搭社区。文章还提供了详细的部署指南,包括 API 调用、vLLM、SGLang、llama.cpp 和 Transformers 等多种部署方式。

💡 主要观点

- Step 3.7 Flash 采用 196B MoE 架构,激活参数仅 11B,实现高效推理。 通过稀疏 MoE 架构,模型在保持 196B 总参数容量的同时,每次推理仅激活 11B 参数,最高生成速度达 400 Tokens/s,在能力与效率间取得平衡。

模型面向生产级 Agent 场景进行了系统优化,包括多模态理解、搜索增强和工具调用。 模型具备原生多模态理解能力,可处理 UI、图表等复杂视觉信息;强化了联网与视觉搜索,支持跨文本与图像的多源证据交叉比对;在多轮 Agent 工作流中能稳定调用 API、浏览器、终端等外部系统。
模型已适配主流 Agent 框架和工具调用协议,降低了接入成本。 Step 3.7 Flash 已兼容 Claude Code、OpenClaw、Hermes Agent 等框架,支持 MCP/Skills 协议,并提供多种部署方式(vLLM、SGLang、llama.cpp 等),方便开发者快速集成。

💬 文章金句

- 下一阶段的模型竞争,不只是峰值智能,而是可规模化的高效智能。

  • 随着 Agent 从 Demo 走向真实生产环境,模型不只要回答问题,更要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮任务中持续保持执行轨迹。
  • Step 3.7 Flash 采用稀疏 MoE 架构,总参数 196B+1.8B(ViT)、激活参数仅 11B ,在模型能力、推理成本与执行效率之间实现更优平衡。

📊 文章信息

AI 初评:86

来源:魔搭ModelScope社区

作者:魔搭ModelScope社区

分类:人工智能

语言:中文

阅读时间:10 分钟

字数:2382

标签: 阶跃星辰, Step 3.7 Flash, MoE, 多模态, Agent

阅读完整文章

查看原文 → 發佈: 2026-05-29 16:00:00 收錄: 2026-05-30 00:00:00

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。