阶跃星辰发布并开源 Step 3.7 Flash 模型,这是一款面向生产级 Agent 的高效率多模态模型,采用 196B MoE 架构,激活参数仅 11B,最高生成速度达 400 Tokens/s,并具备原生多模态理解与高可靠工具调用能力。
📝 详细摘要
阶跃星辰正式发布并开源 Step 3.7 Flash 模型,该模型专为生产级 Agent 场景设计。核心特性包括:采用 196B 总参数 + 1.8B ViT 的稀疏 MoE 架构,激活参数仅 11B,实现了模型能力与推理效率的平衡;最高生成速度达 400 Tokens/s,适合高频、多轮 Agent 应用;具备原生多模态理解能力,可处理 UI、图表、文档等复杂视觉输入;强化了联网搜索与视觉搜索能力;在工具调用方面表现出色,支持 API、浏览器、终端等外部系统的高可靠调用与编排。模型已适配 Claude Code、OpenClaw、Hermes Agent 等主流 Agent 框架,支持 MCP/Skills 协议,并已上架魔搭社区。文章还提供了详细的部署指南,包括 API 调用、vLLM、SGLang、llama.cpp 和 Transformers 等多种部署方式。
💡 主要观点
- Step 3.7 Flash 采用 196B MoE 架构,激活参数仅 11B,实现高效推理。 通过稀疏 MoE 架构,模型在保持 196B 总参数容量的同时,每次推理仅激活 11B 参数,最高生成速度达 400 Tokens/s,在能力与效率间取得平衡。
💬 文章金句
- 下一阶段的模型竞争,不只是峰值智能,而是可规模化的高效智能。
- 随着 Agent 从 Demo 走向真实生产环境,模型不只要回答问题,更要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮任务中持续保持执行轨迹。
- Step 3.7 Flash 采用稀疏 MoE 架构,总参数 196B+1.8B(ViT)、激活参数仅 11B ,在模型能力、推理成本与执行效率之间实现更优平衡。
📊 文章信息
AI 初评:86
来源:魔搭ModelScope社区
作者:魔搭ModelScope社区
分类:人工智能
语言:中文
阅读时间:10 分钟
字数:2382
标签: 阶跃星辰, Step 3.7 Flash, MoE, 多模态, Agent