一手实测 Step 3.7 Flash：目前最快的开源模型

📌 一句话摘要

本文一手实测了阶跃星辰最新发布的 Step 3.7 Flash 模型，重点验证其 400 TPS 的超快速度、原生视觉理解能力和 Agent 长程任务表现，并指出其在 Coding 和 3D 推理方面与顶级模型仍有差距。

📝 详细摘要

文章对阶跃星辰发布的 Step 3.7 Flash 模型进行了全面的实测体验。该模型以 400 TPS 的超高输出速度和原生多模态视觉理解能力为核心卖点，总参数 198B（激活 11B），支持 256k 上下文，并已开源。作者通过视觉编程、视觉理解、Agent 长程任务和 3D 推理四个案例进行测试，结果显示：模型在视觉理解、Agent 任务执行（如联网搜索、生成报告和 PPT）以及速度方面表现惊艳，尤其在结合视觉能力的实时交互场景中潜力巨大。然而，其 Coding 能力与 GPT/Claude 等顶级模型相比仍有差距，3D 推理能力也较弱。文章还介绍了其开源情况、API 定价（兼容 OpenAI 和 Anthropic 协议）以及丰富的生态支持。

💡 主要观点

- Step 3.7 Flash 的核心优势在于极致的输出速度（400 TPS）和原生多模态视觉理解能力。 在同级别开源模型中，同时具备高速推理和视觉理解能力的模型非常稀缺，这使其在实时交互、AI 眼镜、智能驾驶等场景中具有独特优势。

模型在 Agent 长程任务和视觉理解任务上表现优异，能高效完成多步骤复杂指令。 实测中，模型能快速理解 Photoshop 界面并给出操作步骤，也能自主完成联网搜索、生成 Word 报告和制作 PPT 的复杂 Agent 任务，展现了强大的任务规划与执行能力。

模型的 Coding 和 3D 推理能力与顶级模型存在差距，是其当前的主要短板。 在 3D 编程和复杂推理任务中，模型 one shot 输出的结果存在逻辑错误，表明其在代码生成和空间推理方面尚未达到顶尖水平。

💬 文章金句

- 官方说，它的输出速度能拉到 400 Token/s。

而且，它还原生支持视觉理解，图片、视频都能看懂。
只要速度足够快，是不是可以有实时渲染的新交互产品诞生？AI 游戏产品会不会加速到来？
当然，实话实说，它的 Coding 能力距离顶尖模型还有差距。
但是他快啊，而且有多模态。

📊 文章信息

AI 初评：85

来源：沃垠AI

作者： (沃垠AI)

分类：人工智能

语言：中文

阅读时间：9 分钟

字数：2166

标签： Step 3.7 Flash, 阶跃星辰, 多模态模型, 开源模型, 视觉理解

阅读完整文章

一手实测 Step 3.7 Flash：目前最快的开源模型

🤖 問 AI