智在无界发布隐式世界模型 Being-H-Flash,在百 TOPS 端侧芯片上实现实时运行,月度算力成本降至 150 元,仅为英伟达 Cosmos 方案的 2%。
📝 详细摘要
文章报道了智在无界(BeingBeyond)发布的隐式世界模型产品 Being-H-Flash。核心亮点在于:该模型是全球首个在百 TOPS 级端侧芯片(如 Orin NX)上实现接近 20FPS 实时运行的世界模型,月度算力成本仅 150 元,远低于英伟达 Cosmos-Policy 等显式方案。文章详细解释了其技术路线:区别于逐帧生成未来画面的显式世界模型,Being-H-Flash 采用隐式世界模型,在潜空间(Latent Space)中进行未来状态推演,避免了像素级生成带来的巨大计算开销。模型基于超过 20 万小时人类视频和 1.5 万小时机器人示教数据训练,并配合自研的 UAC 异步推理技术。文章进一步阐述了端侧部署对机器人实时闭环控制的重要性(如接球、倒水等动态任务),以及将成本压至百元级对世界模型大规模商业落地的意义。最后介绍了团队背景与产品矩阵。
💡 主要观点
- Being-H-Flash 是全球首个在百 TOPS 端侧芯片上实时运行的世界模型。 该模型在类似 Orin NX 的端侧算力条件下实现接近 20FPS 的实时推理,解决了此前世界模型依赖云端部署带来的延迟和断连风险,使机器人能实现实时闭环控制。
💬 文章金句
- 决定它能否走出实验室的,从来不只是能力上限。更重要的,是谁能先把它装进机器人、放进产线,再把成本打到产业愿意买单的位置。
- 它依然在预测未来,只是不再通过「画出来」的方式。
📊 文章信息
AI 初评:86
来源:量子位
作者:henry
分类:人工智能
语言:中文
阅读时间:15 分钟
字数:3501
标签: 具身智能, 世界模型, AI Agent, 机器人, 模型训练与推理