生数科技认领了神秘登顶双榜的机器人通用大脑 MotuBrain,该模型基于世界动作模型路线,实现了跨本体、跨任务的复杂长程任务执行,打通了数字世界与物理世界的统一智能。
📝 详细摘要
本文报道了生数科技发布机器人通用大脑模型 MotuBrain 的新闻。该模型在 WorldArena 和 RoboTwin2.0 两个国际 benchmark 上同时登顶,分别测试了模型对物理世界的理解能力和实际任务执行能力。MotuBrain 的核心技术路线是 World Action Model,将世界模型的预测推演与行动指令输出融合在同一个模型中,实现了「边看边动」。文章详细展示了 MotuBrain 的四大核心能力:一脑多型(跨机器人本体通用)、一脑贯通(完成 10 个原子动作级别的长程任务)、一脑预见(基于物理理解自主决策)、一脑多能(多任务混学,成功率随任务数量增加而提升)。技术根基来自生数科技此前开源的 Motus 世界模型,底层基于 U-ViT 架构实现多模态统一建模。生数科技的战略是双轨并行:Vidu 视频大模型通往数字世界,MotuBrain 通往物理世界,两者共享同一技术基座。公司已完成近 20 亿元 B 轮融资,并与多家机器人公司达成战略合作。
💡 主要观点
- MotuBrain 同时登顶 WorldArena 和 RoboTwin2.0 两个国际 benchmark。 WorldArena 测试模型对物理世界的理解能力,RoboTwin2.0 测试实际任务执行能力。MotuBrain 在运动质量、动作平滑度等维度均获第一,且在随机环境下平均分超过 95,实现断崖式领先。
💬 文章金句
- MotuBrain 既具备世界模型的预测推演能力,又能输出行动指令,真正做到「知行合一」。
- MotuBrain 真正厉害之处,不在于多复杂的技术堆砌,而在于用「统一建模」打通了机器人的「感知、理解、行动」,让机器人真正从「机械执行」,走向「智能决策」。
- 如果说视频是理解世界的起点,那么让 AI 真正走进物理世界才是所有玩家的终点。
- 当别人还在纠结该走 World Model 还是 VLA 时,生数科技用同一个模型同时做到了行业第一。
📊 文章信息
AI 初评:88
来源:量子位
作者:田, 晏林
分类:人工智能
语言:中文
阅读时间:27 分钟
字数:6608
标签: 生数科技, MotuBrain, 世界动作模型, 具身智能, 机器人通用大脑