机器人原生世界动作模型问世！首创时空一体架构，复旦系团队出品

📌 一句话摘要

复旦系科创企业眸深智能发布专为机器人原生打造的 STI-WM 时空一体世界动作模型，以时空一体化建模和物理一致性约束为核心，旨在解决当前具身智能领域空间感知不足、物理逻辑缺失等痛点。

📝 详细摘要

本文报道了复旦系科创企业眸深智能推出的 STI-WM 时空一体世界动作模型。该模型定位为机器人原生通用具身大脑，核心创新在于时空一体化原生建模、物理一致性引擎和端到端原生融合，旨在解决当前 VLA 模型、通用世界模型在空间感知、物理约束和长时序规划上的不足。文章介绍了团队背景（复旦深度学习实验室、前英特尔首席科学家等）、技术积累（7 代模型迭代、CVPR/ICCV 冠军、IJCAI 杰出论文奖）以及商业化进展（半年 5 轮融资、与宇树科技等头部企业合作）。模型架构支持多模态输入、百秒级长时程任务推演和端侧轻量化部署，强调从视觉合理到物理可行的技术跨越。

💡 主要观点

- STI-WM 模型以时空一体化原生建模为核心，打破传统 VLA 模型的模态割裂。 该模型将空间结构与时间动态实时耦合，消除多模块拼接的信息损耗，提升推理效率与决策精准度，实现端到端原生映射。

模型内置物理一致性引擎，从底层保障真机执行的安全与稳定。 融合碰撞检测、动力学约束，杜绝不合理动作与环境崩坏，解决传统视频生成模型仅追求视觉逼真而忽视物理可行性的问题。

团队具备深厚学术积累与快速商业化能力，半年内完成 5 轮融资。 核心团队源自复旦大学，拥有 CVPR/ICCV 冠军、IJCAI 杰出论文奖等学术荣誉，并与宇树科技、禾川科技等头部企业达成合作，未来三年预计锁定 10 亿元订单。

💬 文章金句

- 机器人与物理世界的一切交互，最终都落地为动作，唯有精准理解时空演化规律、遵守物理逻辑、实现端到端原生映射，才能真正解决机器人泛化性差、落地难的行业顽疾。

STI-WM 跳出纯视觉推演误区，以三维几何约束、动力学校验、真机闭环执行为核心，彻底解决传统模型信息失真、泛化薄弱、落地困难的核心痛点。
AGI 竞争正式进入物理智能新时代，以世界动作模型为核心的原生具身大脑，已然成为通用机器人的核心底座。

📊 文章信息

AI 初评：82

来源：量子位

作者：思邈

分类：人工智能

语言：中文

阅读时间：10 分钟

字数：2451

标签：具身智能, 世界模型, 机器人, STI-WM, 眸深智能

阅读完整文章

机器人原生世界动作模型问世！首创时空一体架构，复旦系团队出品

🤖 問 AI