生数科技认领神秘登顶模型：AI 视频公司拿出工业级 Demo，跨本体跑通复杂长程任务

📌 一句话摘要

生数科技认领了神秘登顶双榜的机器人通用大脑 MotuBrain，该模型基于世界动作模型路线，实现了跨本体、跨任务的复杂长程任务执行，打通了数字世界与物理世界的统一智能。

📝 详细摘要

本文报道了生数科技发布机器人通用大脑模型 MotuBrain 的新闻。该模型在 WorldArena 和 RoboTwin2.0 两个国际 benchmark 上同时登顶，分别测试了模型对物理世界的理解能力和实际任务执行能力。MotuBrain 的核心技术路线是 World Action Model，将世界模型的预测推演与行动指令输出融合在同一个模型中，实现了「边看边动」。文章详细展示了 MotuBrain 的四大核心能力：一脑多型（跨机器人本体通用）、一脑贯通（完成 10 个原子动作级别的长程任务）、一脑预见（基于物理理解自主决策）、一脑多能（多任务混学，成功率随任务数量增加而提升）。技术根基来自生数科技此前开源的 Motus 世界模型，底层基于 U-ViT 架构实现多模态统一建模。生数科技的战略是双轨并行：Vidu 视频大模型通往数字世界，MotuBrain 通往物理世界，两者共享同一技术基座。公司已完成近 20 亿元 B 轮融资，并与多家机器人公司达成战略合作。

💡 主要观点

- MotuBrain 同时登顶 WorldArena 和 RoboTwin2.0 两个国际 benchmark。 WorldArena 测试模型对物理世界的理解能力，RoboTwin2.0 测试实际任务执行能力。MotuBrain 在运动质量、动作平滑度等维度均获第一，且在随机环境下平均分超过 95，实现断崖式领先。

MotuBrain 采用 World Action Model 技术路线，实现「边看边动」。 不同于先预测再行动的「先看后动派」或直接执行的 VLA 路线，World Action Model 将推演和行动融合在同一模型中，决策与推演同时发生，响应更快且偏差不相互放大。

MotuBrain 具备一脑多型、一脑贯通、一脑预见、一脑多能四大核心能力。 模型可跨不同型号机器人通用，能完成 10 个原子动作级别的长程任务，具备基于物理理解的自主决策能力，且多任务混学使成功率随任务数量增加而提升。

生数科技采用 Vidu + MotuBrain 双轨战略，共享 U-ViT 架构基座。 Vidu 视频大模型通往数字世界，MotuBrain 通往物理世界，两者基于同一底层架构。视频模型积累的物理世界理解能力可直接迁移到机器人大脑，形成独特的技术护城河。

💬 文章金句

- MotuBrain 既具备世界模型的预测推演能力，又能输出行动指令，真正做到「知行合一」。

MotuBrain 真正厉害之处，不在于多复杂的技术堆砌，而在于用「统一建模」打通了机器人的「感知、理解、行动」，让机器人真正从「机械执行」，走向「智能决策」。
如果说视频是理解世界的起点，那么让 AI 真正走进物理世界才是所有玩家的终点。
当别人还在纠结该走 World Model 还是 VLA 时，生数科技用同一个模型同时做到了行业第一。

📊 文章信息

AI 初评：88

来源：量子位

作者：田, 晏林

分类：人工智能

语言：中文

阅读时间：27 分钟

字数：6608

标签：生数科技, MotuBrain, 世界动作模型, 具身智能, 机器人通用大脑

阅读完整文章

生数科技认领神秘登顶模型：AI 视频公司拿出工业级 Demo，跨本体跑通复杂长程任务

🤖 問 AI