← 回總覽

一个 GPT Plus 会员的钱,够机器人跑一个月世界模型了

📅 2026-06-04 11:10 henry 人工智能 2 分鐘 1328 字 評分: 86
具身智能 世界模型 AI Agent 机器人 模型训练与推理
📌 一句话摘要 智在无界发布隐式世界模型 Being-H-Flash,在百 TOPS 端侧芯片上实现实时运行,月度算力成本降至 150 元,仅为英伟达 Cosmos 方案的 2%。 📝 详细摘要 文章报道了智在无界(BeingBeyond)发布的隐式世界模型产品 Being-H-Flash。核心亮点在于:该模型是全球首个在百 TOPS 级端侧芯片(如 Orin NX)上实现接近 20FPS 实时运行的世界模型,月度算力成本仅 150 元,远低于英伟达 Cosmos-Policy 等显式方案。文章详细解释了其技术路线:区别于逐帧生成未来画面的显式世界模型,Being-H-Flash 采用隐式

📌 一句话摘要

智在无界发布隐式世界模型 Being-H-Flash,在百 TOPS 端侧芯片上实现实时运行,月度算力成本降至 150 元,仅为英伟达 Cosmos 方案的 2%。

📝 详细摘要

文章报道了智在无界(BeingBeyond)发布的隐式世界模型产品 Being-H-Flash。核心亮点在于:该模型是全球首个在百 TOPS 级端侧芯片(如 Orin NX)上实现接近 20FPS 实时运行的世界模型,月度算力成本仅 150 元,远低于英伟达 Cosmos-Policy 等显式方案。文章详细解释了其技术路线:区别于逐帧生成未来画面的显式世界模型,Being-H-Flash 采用隐式世界模型,在潜空间(Latent Space)中进行未来状态推演,避免了像素级生成带来的巨大计算开销。模型基于超过 20 万小时人类视频和 1.5 万小时机器人示教数据训练,并配合自研的 UAC 异步推理技术。文章进一步阐述了端侧部署对机器人实时闭环控制的重要性(如接球、倒水等动态任务),以及将成本压至百元级对世界模型大规模商业落地的意义。最后介绍了团队背景与产品矩阵。

💡 主要观点

- Being-H-Flash 是全球首个在百 TOPS 端侧芯片上实时运行的世界模型。 该模型在类似 Orin NX 的端侧算力条件下实现接近 20FPS 的实时推理,解决了此前世界模型依赖云端部署带来的延迟和断连风险,使机器人能实现实时闭环控制。

其核心技术路线是隐式世界模型,在潜空间推演未来而非生成像素画面。 与英伟达 Cosmos 等显式方案不同,隐式模型将预测从像素空间转移到潜空间,省去了逐帧视频生成的计算开销,这是实现低成本端侧部署的关键。
月度算力成本降至 150 元,仅为 Cosmos 方案的 2%,为规模化落地扫清经济障碍。 在仓储物流等场景中,单台机器人每月算力成本仅 150 元,使过去因成本过高而无法部署的场景(如产线、商超)具备了规模化应用的可能。

💬 文章金句

- 决定它能否走出实验室的,从来不只是能力上限。更重要的,是谁能先把它装进机器人、放进产线,再把成本打到产业愿意买单的位置。

  • 它依然在预测未来,只是不再通过「画出来」的方式。

📊 文章信息

AI 初评:86

来源:量子位

作者:henry

分类:人工智能

语言:中文

阅读时间:15 分钟

字数:3501

标签: 具身智能, 世界模型, AI Agent, 机器人, 模型训练与推理

阅读完整文章

查看原文 → 發佈: 2026-06-04 11:10:23 收錄: 2026-06-04 16:00:38

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。