← 回總覽

机器人原生世界动作模型问世!首创时空一体架构,复旦系团队出品

📅 2026-05-31 18:13 思邈 人工智能 2 分鐘 1294 字 評分: 82
具身智能 世界模型 机器人 STI-WM 眸深智能
📌 一句话摘要 复旦系科创企业眸深智能发布专为机器人原生打造的 STI-WM 时空一体世界动作模型,以时空一体化建模和物理一致性约束为核心,旨在解决当前具身智能领域空间感知不足、物理逻辑缺失等痛点。 📝 详细摘要 本文报道了复旦系科创企业眸深智能推出的 STI-WM 时空一体世界动作模型。该模型定位为机器人原生通用具身大脑,核心创新在于时空一体化原生建模、物理一致性引擎和端到端原生融合,旨在解决当前 VLA 模型、通用世界模型在空间感知、物理约束和长时序规划上的不足。文章介绍了团队背景(复旦深度学习实验室、前英特尔首席科学家等)、技术积累(7 代模型迭代、CVPR/ICCV 冠军、IJCA

📌 一句话摘要

复旦系科创企业眸深智能发布专为机器人原生打造的 STI-WM 时空一体世界动作模型,以时空一体化建模和物理一致性约束为核心,旨在解决当前具身智能领域空间感知不足、物理逻辑缺失等痛点。

📝 详细摘要

本文报道了复旦系科创企业眸深智能推出的 STI-WM 时空一体世界动作模型。该模型定位为机器人原生通用具身大脑,核心创新在于时空一体化原生建模、物理一致性引擎和端到端原生融合,旨在解决当前 VLA 模型、通用世界模型在空间感知、物理约束和长时序规划上的不足。文章介绍了团队背景(复旦深度学习实验室、前英特尔首席科学家等)、技术积累(7 代模型迭代、CVPR/ICCV 冠军、IJCAI 杰出论文奖)以及商业化进展(半年 5 轮融资、与宇树科技等头部企业合作)。模型架构支持多模态输入、百秒级长时程任务推演和端侧轻量化部署,强调从视觉合理到物理可行的技术跨越。

💡 主要观点

- STI-WM 模型以时空一体化原生建模为核心,打破传统 VLA 模型的模态割裂。 该模型将空间结构与时间动态实时耦合,消除多模块拼接的信息损耗,提升推理效率与决策精准度,实现端到端原生映射。

模型内置物理一致性引擎,从底层保障真机执行的安全与稳定。 融合碰撞检测、动力学约束,杜绝不合理动作与环境崩坏,解决传统视频生成模型仅追求视觉逼真而忽视物理可行性的问题。
团队具备深厚学术积累与快速商业化能力,半年内完成 5 轮融资。 核心团队源自复旦大学,拥有 CVPR/ICCV 冠军、IJCAI 杰出论文奖等学术荣誉,并与宇树科技、禾川科技等头部企业达成合作,未来三年预计锁定 10 亿元订单。

💬 文章金句

- 机器人与物理世界的一切交互,最终都落地为动作,唯有精准理解时空演化规律、遵守物理逻辑、实现端到端原生映射,才能真正解决机器人泛化性差、落地难的行业顽疾。

  • STI-WM 跳出纯视觉推演误区,以三维几何约束、动力学校验、真机闭环执行为核心,彻底解决传统模型信息失真、泛化薄弱、落地困难的核心痛点。
  • AGI 竞争正式进入物理智能新时代,以世界动作模型为核心的原生具身大脑,已然成为通用机器人的核心底座。

📊 文章信息

AI 初评:82

来源:量子位

作者:思邈

分类:人工智能

语言:中文

阅读时间:10 分钟

字数:2451

标签: 具身智能, 世界模型, 机器人, STI-WM, 眸深智能

阅读完整文章

查看原文 → 發佈: 2026-05-31 18:13:21 收錄: 2026-06-01 12:00:44

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。