本文一手实测了阶跃星辰最新发布的 Step 3.7 Flash 模型,重点验证其 400 TPS 的超快速度、原生视觉理解能力和 Agent 长程任务表现,并指出其在 Coding 和 3D 推理方面与顶级模型仍有差距。
📝 详细摘要
文章对阶跃星辰发布的 Step 3.7 Flash 模型进行了全面的实测体验。该模型以 400 TPS 的超高输出速度和原生多模态视觉理解能力为核心卖点,总参数 198B(激活 11B),支持 256k 上下文,并已开源。作者通过视觉编程、视觉理解、Agent 长程任务和 3D 推理四个案例进行测试,结果显示:模型在视觉理解、Agent 任务执行(如联网搜索、生成报告和 PPT)以及速度方面表现惊艳,尤其在结合视觉能力的实时交互场景中潜力巨大。然而,其 Coding 能力与 GPT/Claude 等顶级模型相比仍有差距,3D 推理能力也较弱。文章还介绍了其开源情况、API 定价(兼容 OpenAI 和 Anthropic 协议)以及丰富的生态支持。
💡 主要观点
- Step 3.7 Flash 的核心优势在于极致的输出速度(400 TPS)和原生多模态视觉理解能力。 在同级别开源模型中,同时具备高速推理和视觉理解能力的模型非常稀缺,这使其在实时交互、AI 眼镜、智能驾驶等场景中具有独特优势。
💬 文章金句
- 官方说,它的输出速度能拉到 400 Token/s。
- 而且,它还原生支持视觉理解,图片、视频都能看懂。
- 只要速度足够快,是不是可以有实时渲染的新交互产品诞生?AI 游戏产品会不会加速到来?
- 当然,实话实说,它的 Coding 能力距离顶尖模型还有差距。
- 但是他快啊,而且有多模态。
📊 文章信息
AI 初评:85
来源:沃垠AI
作者: (沃垠AI)
分类:人工智能
语言:中文
阅读时间:9 分钟
字数:2166
标签: Step 3.7 Flash, 阶跃星辰, 多模态模型, 开源模型, 视觉理解