蚂蚁集团旗下灵光 App 上线世界模型体验功能,用户上传图片即可在手机端实时生成 3D 世界并自由漫游,背后是开源的实时世界模型 LingBot-World-Fast。
📝 详细摘要
蚂蚁集团旗下全模态 AI 助手灵光 App 于 4 月 27 日上线「体验世界模型」功能,用户上传一张图片即可在手机端生成一个 60 秒的 3D 世界,并以第一人称视角在其中实时漫游。该功能无需本地部署,面向普通用户开放,是世界模型首次以移动端产品形态落地。支撑该体验的核心是蚂蚁灵波科技开源的世界模型 LingBot-World-Fast,该模型在 480P 分辨率下可实现 16 fps 实时生成,端到端交互延迟控制在 1 秒以内。模型采用专门的后训练优化方案,在生成过程中只聚焦新增画面内容,避免重复计算已稳定的部分,从而提升实时生成效率。除了面向普通用户的 App 体验,开发者也可基于开源模型进行本地部署和二次开发,支持键盘鼠标实时操控视角与移动,以及通过文本提示改变环境状态。该模型对具身智能研发和游戏内容创作均有重要应用价值。
💡 主要观点
- 世界模型首次以移动端产品形态面向普通用户开放。 用户上传一张图片即可在手机端生成 60 秒 3D 世界,以第一人称视角实时漫游,无需本地部署,降低了世界模型的使用门槛。
💬 文章金句
- 用户上传一张图片,即可在手机端生成一个 60s 的 3D 世界,以第一人称视角进入其中,像玩游戏一样在 AI 实时生成的场景中漫游。
- 该模型在 480P 分辨率下可实现 16 fps 实时生成,端到端交互延迟控制在 1 秒以内。
- 模型在生成过程中只聚焦新增画面内容,不再重复计算已稳定的部分,从而显著提升实时生成效率。
📊 文章信息
AI 初评:86
来源:量子位
作者:量子位的朋友们
分类:人工智能
语言:中文
阅读时间:4 分钟
字数:785
标签: 世界模型, 蚂蚁集团, LingBot-World-Fast, 实时生成, 3D 世界