本文通过亲身体验腾讯混元 3D 世界模型 2.0,结合对阿里、英伟达、李飞飞团队同期发布的世界模型分析,探讨了 AI 从生成 2D 内容迈向构建可交互 3D 世界的技术进展、应用场景及其对 3D 设计工作流的潜在颠覆。
📝 详细摘要
文章围绕近期密集发布的世界模型(腾讯混元 2.0、阿里 HappyOyster、英伟达 Lyra 2.0、李飞飞 Spark 2.0)展开,以腾讯混元 2.0 的深度体验为核心。作者通过输入「吉卜力风格的山间小镇,黄昏」等提示词,展示了模型如何生成可直接导入 Unity/Unreal Engine 的多种 3D 资产文件(Mesh、3DGS、点云),并支持角色在生成场景中实时漫游、跳跃,具备物理碰撞。文章对比了各模型的差异化路线:腾讯侧重资产生成与交互、阿里聚焦剧情演化、英伟达瞄准机器人仿真、李飞飞团队攻克移动端交付。作者认为,虽然世界模型尚未迎来其「ChatGPT 时刻」,但已清晰展示了 AI 从辅助平面设计转向主导 3D 内容创作的趋势,未来将深刻重塑游戏开发、影视制作、仿真训练等领域的工作流。
💡 主要观点
- 世界模型正从生成 2D 视频迈向构建可交互的 3D 空间,标志着 AI 内容创作的新阶段。 以腾讯混元 2.0 为例,其生成的不再是 MP4 文件,而是包含 Mesh、3DGS 等格式的 3D 资产,可直接用于游戏引擎,并支持角色实时漫游与物理交互,模糊了 AI 生成与游戏开发的边界。
💬 文章金句
- 现在的 AI 已经从「生成一张图、一段视频」的平面阶段,大步来到「构建一个世界」的 3D 空间时代。
- 点击下载,混元 3D 提供了全景图、Splats 的 .spz 文件和 .ply 文件,以及 Collider mesh 一共四种 3D 资产文件格式。这些文件可以直接导入 Unity、Unreal Engine,游戏开发者拿到手之后可以继续编辑、调整、搭建关卡。
- 这种即刻生成、即刻可玩的体验,确实在模糊了 AI 生成与游戏引擎之间的边界。
- 很明显,世界模型还没迎来它的 ChatGPT 时刻。四家公司这一周的密集发布更像是在为这个时刻做准备。
- 现在,这朵雪花大概是要飘到 3D 设计的护城河上。随着更多模型厂商的下场,3D 设计的工作流也会慢慢从 AI 辅助走向 AI 主导。
📊 文章信息
AI 初评:87
来源:爱范儿
作者:张子豪
分类:人工智能
语言:中文
阅读时间:12 分钟
字数:2811
标签: 世界模型, 3D生成, 腾讯混元, AI产品评测, 空间智能