英伟达发布了最新的世界生成模型 Lyra 2.0,它结合视频生成与 3D 重建,解决了场景持久一致性问题,能够从单张图片生成可交互探索的 3D 世界。
📝 详细摘要
这条推文介绍了英伟达最新发布的世界生成模型 Lyra 2.0。该模型旨在解决 AI 生成大规模 3D 环境时常见的空间遗忘和长程漂移问题。其核心创新在于将视频生成(保证视觉质量)与逐帧 3D 几何重建(用于信息路由)相结合,并通过自增强训练来纠正时间漂移。用户可以从单张图片启动,生成一个完整的 3D 世界,并能在其中进行渐进式生成和交互探索,边走边建,且可以导出为 3DGS 和网格格式。推文引用了英伟达官方发布,并附带了演示视频。
📊 文章信息
AI 初评:86
来源:AIGCLINK(@aigclink)
作者:AIGCLINK
分类:人工智能
语言:中文
阅读时间:2 分钟
字数:278
标签: Lyra 2.0, 英伟达, 世界模型, 3D 生成, AI 研究