← 回總覽

生数科技认领神秘登顶模型:AI 视频公司拿出工业级 Demo,跨本体跑通复杂长程任务

📅 2026-04-30 08:35 田, 晏林 人工智能 2 分鐘 1731 字 評分: 88
生数科技 MotuBrain 世界动作模型 具身智能 机器人通用大脑
📌 一句话摘要 生数科技认领了神秘登顶双榜的机器人通用大脑 MotuBrain,该模型基于世界动作模型路线,实现了跨本体、跨任务的复杂长程任务执行,打通了数字世界与物理世界的统一智能。 📝 详细摘要 本文报道了生数科技发布机器人通用大脑模型 MotuBrain 的新闻。该模型在 WorldArena 和 RoboTwin2.0 两个国际 benchmark 上同时登顶,分别测试了模型对物理世界的理解能力和实际任务执行能力。MotuBrain 的核心技术路线是 World Action Model,将世界模型的预测推演与行动指令输出融合在同一个模型中,实现了「边看边动」。文章详细展示了 Mo

📌 一句话摘要

生数科技认领了神秘登顶双榜的机器人通用大脑 MotuBrain,该模型基于世界动作模型路线,实现了跨本体、跨任务的复杂长程任务执行,打通了数字世界与物理世界的统一智能。

📝 详细摘要

本文报道了生数科技发布机器人通用大脑模型 MotuBrain 的新闻。该模型在 WorldArena 和 RoboTwin2.0 两个国际 benchmark 上同时登顶,分别测试了模型对物理世界的理解能力和实际任务执行能力。MotuBrain 的核心技术路线是 World Action Model,将世界模型的预测推演与行动指令输出融合在同一个模型中,实现了「边看边动」。文章详细展示了 MotuBrain 的四大核心能力:一脑多型(跨机器人本体通用)、一脑贯通(完成 10 个原子动作级别的长程任务)、一脑预见(基于物理理解自主决策)、一脑多能(多任务混学,成功率随任务数量增加而提升)。技术根基来自生数科技此前开源的 Motus 世界模型,底层基于 U-ViT 架构实现多模态统一建模。生数科技的战略是双轨并行:Vidu 视频大模型通往数字世界,MotuBrain 通往物理世界,两者共享同一技术基座。公司已完成近 20 亿元 B 轮融资,并与多家机器人公司达成战略合作。

💡 主要观点

- MotuBrain 同时登顶 WorldArena 和 RoboTwin2.0 两个国际 benchmark。 WorldArena 测试模型对物理世界的理解能力,RoboTwin2.0 测试实际任务执行能力。MotuBrain 在运动质量、动作平滑度等维度均获第一,且在随机环境下平均分超过 95,实现断崖式领先。

MotuBrain 采用 World Action Model 技术路线,实现「边看边动」。 不同于先预测再行动的「先看后动派」或直接执行的 VLA 路线,World Action Model 将推演和行动融合在同一模型中,决策与推演同时发生,响应更快且偏差不相互放大。
MotuBrain 具备一脑多型、一脑贯通、一脑预见、一脑多能四大核心能力。 模型可跨不同型号机器人通用,能完成 10 个原子动作级别的长程任务,具备基于物理理解的自主决策能力,且多任务混学使成功率随任务数量增加而提升。
生数科技采用 Vidu + MotuBrain 双轨战略,共享 U-ViT 架构基座。 Vidu 视频大模型通往数字世界,MotuBrain 通往物理世界,两者基于同一底层架构。视频模型积累的物理世界理解能力可直接迁移到机器人大脑,形成独特的技术护城河。

💬 文章金句

- MotuBrain 既具备世界模型的预测推演能力,又能输出行动指令,真正做到「知行合一」。

  • MotuBrain 真正厉害之处,不在于多复杂的技术堆砌,而在于用「统一建模」打通了机器人的「感知、理解、行动」,让机器人真正从「机械执行」,走向「智能决策」。
  • 如果说视频是理解世界的起点,那么让 AI 真正走进物理世界才是所有玩家的终点。
  • 当别人还在纠结该走 World Model 还是 VLA 时,生数科技用同一个模型同时做到了行业第一。

📊 文章信息

AI 初评:88

来源:量子位

作者:田, 晏林

分类:人工智能

语言:中文

阅读时间:27 分钟

字数:6608

标签: 生数科技, MotuBrain, 世界动作模型, 具身智能, 机器人通用大脑

阅读完整文章

查看原文 → 發佈: 2026-04-30 08:35:15 收錄: 2026-04-30 10:00:08

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。