浙大创业团队影溯(InSpatio)开源 InSpatio-World 实时世界模型,通过 3D 空间架构实现低成本、高帧率的 4D 物理仿真与交互。
📝 详细摘要
本文详细介绍了中国初创公司影溯(InSpatio)发布的开源世界模型 InSpatio-World。该模型在李飞飞牵头的 WorldScore-Dynamic 榜单中位列实时交互类首位。技术上,它摒弃了主流的 2D 视频生成路径,采用“状态锚定世界建模”范式,将海量 2D 视频转化为可学习的 3D 动态表示,实现了从像素模拟到物理仿真的跨越。该模型具有极高的算力效率,仅需百卡级训练成本,并在单张 RTX 4090 显卡上实现实时推理,为具身智能、自动驾驶及空间内容生产提供了高效的底层仿真支撑。
💡 主要观点
- 采用 3D 空间架构而非纯 2D 视频统计路径。 解决了 2D 路径缺乏显式几何约束导致的物理一致性坍塌问题,确保了物体在复杂交互和长程演化中的逻辑稳定性。
💬 文章金句
- 所谓世界模型,是 AI 的‘内生物理引擎’。
- 影溯用实战证明了 3D 路径近乎碾压的代际效率优势。
- 交付的不再是静态、单向的视频切片,而是一个响应式、可交互的‘鲜活世界’。
- 从‘模拟像素’到‘模拟存在’,世界模型正在逼近‘真实’。
📊 文章信息
AI 评分:83
来源:机器之心
作者:机器之心
分类:人工智能
语言:中文
阅读时间:16 分钟
字数:3847
标签: 世界模型, InSpatio, 3D 重建, 4D 仿真, 具身智能