李飞飞旗下 World Labs 开源了 Spark 2.0,这是一个专为网页端设计的 3D 高斯点云渲染引擎,通过连续 LoD 树、流式加载和 GPU 虚拟内存三项技术,实现了在手机浏览器中流畅渲染上亿粒子的超大 3D 场景。
📝 详细摘要
文章报道了李飞飞 AI 世界模型公司 World Labs 最新发布并开源的 Spark 2.0 渲染引擎。该引擎旨在解决将高质量、动辄数千万乃至上亿个高斯斑点(splat)构成的 3D 场景,流畅运行在普通手机浏览器中的技术难题。Spark 2.0 的核心创新在于三项技术的组合:1)构建连续 LoD 树,根据视角动态选择渲染细节,将实际送入 GPU 的 splat 数量稳定控制在移动端约 50 万的预算内;2)设计了全新的 .RAD 流式文件格式,支持从模糊到精细的渐进式加载;3)引入 GPU 虚拟内存管理机制,在有限的显存中调度无限大的场景数据。文章详细解释了这些技术的原理,并列举了开发者利用 Spark 2.0 构建游戏、艺术体验和大型实景渲染的案例,展示了其跨设备的强悍性能。最后指出,Spark 2.0 与 World Labs 的 Marble 创作平台结合,构成了从 AI 生成 3D 世界到网页端交付的完整链路。
💡 主要观点
- Spark 2.0 的核心目标是解决亿级粒子 3D 场景在网页端,尤其是移动端的流畅渲染难题。 传统高质量 3DGS 场景文件巨大,远超移动设备渲染能力。Spark 2.0 通过一系列工程优化,让在手机浏览器中运行上亿 splat 的场景成为可能,降低了高质量 3D 内容的交付门槛。
💬 文章金句
- Spark 2.0 的核心是三项技术的组合,LoD 细节层级、渐进式流式加载和虚拟内存管理。单独拿出来看,每一项都有先例可循,但三者合力,才撑起了在手机浏览器里流畅渲染亿级 splat 世界的能力。
- 整个过程受一个固定的 splat 预算约束,移动端约 50 万,桌面端约 250 万。场景里总共有多少 splat 都无所谓,实际送上 GPU 的数量始终稳定在预算范围内,帧率自然稳了。
- Spark 2.0 借鉴了操作系统的虚拟内存机制来应对这个问题。系统会在 GPU 上分配一个固定内存池...需要渲染某个区域时调入对应的块,内存满了就按最久未使用的顺序换出旧块。
- 当 AI 能生成无限大的 3D 世界时,我们用什么载体把它交付给每一个普通人?现在,World Labs 给出的最新答案是一个网页链接。
📊 文章信息
AI 初评:87
来源:爱范儿
作者:莫崇宇
分类:人工智能
语言:中文
阅读时间:14 分钟
字数:3308
标签: 3D Gaussian Splatting, Web 3D 渲染, 李飞飞, World Labs, Spark 2.0