← 回總覽

登顶全球权威榜单!浙大创业团队百卡打造开源实时世界模型,视频秒变可交互 4D 世界

📅 2026-03-20 13:00 机器之心 人工智能 1 分鐘 1139 字 評分: 83
世界模型 InSpatio 3D 重建 4D 仿真 具身智能
📌 一句话摘要 浙大创业团队影溯(InSpatio)开源 InSpatio-World 实时世界模型,通过 3D 空间架构实现低成本、高帧率的 4D 物理仿真与交互。 📝 详细摘要 本文详细介绍了中国初创公司影溯(InSpatio)发布的开源世界模型 InSpatio-World。该模型在李飞飞牵头的 WorldScore-Dynamic 榜单中位列实时交互类首位。技术上,它摒弃了主流的 2D 视频生成路径,采用“状态锚定世界建模”范式,将海量 2D 视频转化为可学习的 3D 动态表示,实现了从像素模拟到物理仿真的跨越。该模型具有极高的算力效率,仅需百卡级训练成本,并在单张 RTX 409

📌 一句话摘要

浙大创业团队影溯(InSpatio)开源 InSpatio-World 实时世界模型,通过 3D 空间架构实现低成本、高帧率的 4D 物理仿真与交互。

📝 详细摘要

本文详细介绍了中国初创公司影溯(InSpatio)发布的开源世界模型 InSpatio-World。该模型在李飞飞牵头的 WorldScore-Dynamic 榜单中位列实时交互类首位。技术上,它摒弃了主流的 2D 视频生成路径,采用“状态锚定世界建模”范式,将海量 2D 视频转化为可学习的 3D 动态表示,实现了从像素模拟到物理仿真的跨越。该模型具有极高的算力效率,仅需百卡级训练成本,并在单张 RTX 4090 显卡上实现实时推理,为具身智能、自动驾驶及空间内容生产提供了高效的底层仿真支撑。

💡 主要观点

- 采用 3D 空间架构而非纯 2D 视频统计路径。 解决了 2D 路径缺乏显式几何约束导致的物理一致性坍塌问题,确保了物体在复杂交互和长程演化中的逻辑稳定性。

提出状态锚定世界建模(State-Anchored World Modeling)范式。 通过显式建模世界状态,实现观测视角与物理实体的本质解耦,使时间演化表现为 3D 状态本身的物理更新而非像素扩散。
极高的算力效率与实时推理性能打破了资源瓶颈。 仅需百卡级别训练成本,且能在单张消费级显卡上实现 10-24 FPS 的实时交互,显著降低了物理世界数字化的门槛。
赋能具身智能实现“行动前的模拟”能力。 世界模型让机器人能够在内部推演不同决策路径,从被动响应指令进化为理解环境并自主决策,重塑了多个行业的底层逻辑。

💬 文章金句

- 所谓世界模型,是 AI 的‘内生物理引擎’。

  • 影溯用实战证明了 3D 路径近乎碾压的代际效率优势。
  • 交付的不再是静态、单向的视频切片,而是一个响应式、可交互的‘鲜活世界’。
  • 从‘模拟像素’到‘模拟存在’,世界模型正在逼近‘真实’。

📊 文章信息

AI 评分:83

来源:机器之心

作者:机器之心

分类:人工智能

语言:中文

阅读时间:16 分钟

字数:3847

标签: 世界模型, InSpatio, 3D 重建, 4D 仿真, 具身智能

阅读完整文章

查看原文 → 發佈: 2026-03-20 13:00:00 收錄: 2026-03-20 18:00:38

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。