← 回總覽

一句话,AI 直接给我建了个能跑能跳的「吉卜力」3D 小镇

📅 2026-04-18 01:50 张子豪 人工智能 2 分鐘 1592 字 評分: 87
世界模型 3D生成 腾讯混元 AI产品评测 空间智能
📌 一句话摘要 本文通过亲身体验腾讯混元 3D 世界模型 2.0,结合对阿里、英伟达、李飞飞团队同期发布的世界模型分析,探讨了 AI 从生成 2D 内容迈向构建可交互 3D 世界的技术进展、应用场景及其对 3D 设计工作流的潜在颠覆。 📝 详细摘要 文章围绕近期密集发布的世界模型(腾讯混元 2.0、阿里 HappyOyster、英伟达 Lyra 2.0、李飞飞 Spark 2.0)展开,以腾讯混元 2.0 的深度体验为核心。作者通过输入「吉卜力风格的山间小镇,黄昏」等提示词,展示了模型如何生成可直接导入 Unity/Unreal Engine 的多种 3D 资产文件(Mesh、3DGS、点

📌 一句话摘要

本文通过亲身体验腾讯混元 3D 世界模型 2.0,结合对阿里、英伟达、李飞飞团队同期发布的世界模型分析,探讨了 AI 从生成 2D 内容迈向构建可交互 3D 世界的技术进展、应用场景及其对 3D 设计工作流的潜在颠覆。

📝 详细摘要

文章围绕近期密集发布的世界模型(腾讯混元 2.0、阿里 HappyOyster、英伟达 Lyra 2.0、李飞飞 Spark 2.0)展开,以腾讯混元 2.0 的深度体验为核心。作者通过输入「吉卜力风格的山间小镇,黄昏」等提示词,展示了模型如何生成可直接导入 Unity/Unreal Engine 的多种 3D 资产文件(Mesh、3DGS、点云),并支持角色在生成场景中实时漫游、跳跃,具备物理碰撞。文章对比了各模型的差异化路线:腾讯侧重资产生成与交互、阿里聚焦剧情演化、英伟达瞄准机器人仿真、李飞飞团队攻克移动端交付。作者认为,虽然世界模型尚未迎来其「ChatGPT 时刻」,但已清晰展示了 AI 从辅助平面设计转向主导 3D 内容创作的趋势,未来将深刻重塑游戏开发、影视制作、仿真训练等领域的工作流。

💡 主要观点

- 世界模型正从生成 2D 视频迈向构建可交互的 3D 空间,标志着 AI 内容创作的新阶段。 以腾讯混元 2.0 为例,其生成的不再是 MP4 文件,而是包含 Mesh、3DGS 等格式的 3D 资产,可直接用于游戏引擎,并支持角色实时漫游与物理交互,模糊了 AI 生成与游戏开发的边界。

不同公司的世界模型技术路线差异显著,共同拼凑出未来应用的多元图景。 腾讯混元 2.0 主打资产生成与交互;阿里 HappyOyster 侧重剧情演化的导演模式;英伟达 Lyra 2.0 面向机器人物理训练;李飞飞 Spark 2.0 攻克了移动端超大世界的流式加载技术,各自在画面、交互、仿真、交付等维度优化。
AI 正在从辅助工具转变为 3D 设计工作流的核心驱动者,将大幅降低创作门槛。 过去构建 3D 世界需要专业团队数月时间,现在通过一句话或一张图即可生成可用的原型资产。尽管细节仍需人工调整,但 AI 已开始主导创意到原型的转化环节,预示着 3D 设计师的工作方式将发生根本性变革。

💬 文章金句

- 现在的 AI 已经从「生成一张图、一段视频」的平面阶段,大步来到「构建一个世界」的 3D 空间时代。

  • 点击下载,混元 3D 提供了全景图、Splats 的 .spz 文件和 .ply 文件,以及 Collider mesh 一共四种 3D 资产文件格式。这些文件可以直接导入 Unity、Unreal Engine,游戏开发者拿到手之后可以继续编辑、调整、搭建关卡。
  • 这种即刻生成、即刻可玩的体验,确实在模糊了 AI 生成与游戏引擎之间的边界。
  • 很明显,世界模型还没迎来它的 ChatGPT 时刻。四家公司这一周的密集发布更像是在为这个时刻做准备。
  • 现在,这朵雪花大概是要飘到 3D 设计的护城河上。随着更多模型厂商的下场,3D 设计的工作流也会慢慢从 AI 辅助走向 AI 主导。

📊 文章信息

AI 初评:87

来源:爱范儿

作者:张子豪

分类:人工智能

语言:中文

阅读时间:12 分钟

字数:2811

标签: 世界模型, 3D生成, 腾讯混元, AI产品评测, 空间智能

阅读完整文章

查看原文 → 發佈: 2026-04-18 01:50:37 收錄: 2026-04-17 20:00:57

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。