腾讯开源了其最新的多模态 3D 世界模型 HY-World 2.0,该模型能从文本、图像或视频生成或重建出可直接导入游戏引擎的可编辑 3D 世界。
📝 详细摘要
这条推文转述了腾讯混元(Tencent Hunyuan)团队开源其最新 3D 世界模型 HY-World 2.0 的消息。该模型是多模态的,支持从文本、单视图/多视图图像或视频输入,生成或重建出 3D 世界表示(网格或 3D 高斯点云)。其关键特性在于生成的 3D 资产是可编辑、可持久化的,能直接导入 Blender、Unity、Unreal Engine 等主流游戏引擎或仿真平台。模型还支持第一人称导航和第三人称角色模式,具备物理碰撞效果。推文通过引用官方原文和附带的演示视频,提供了关于模型能力、技术路径(四阶段流水线)以及与同类模型(如 Genie 3, Cosmos, Lyra 2.0)差异的详细信息。
📊 文章信息
AI 初评:82
来源:AIGCLINK(@aigclink)
作者:AIGCLINK
分类:人工智能
语言:中文
阅读时间:2 分钟
字数:343
标签: HY-World 2.0, 3D 世界模型, 腾讯混元, 多模态生成, 3D 重建