← 回總覽

哪条路线,才能通往「世界模型」的终局?|对话黄碧薇:Aether AI 创始人

📅 2026-06-19 00:00 十字路口Crossing 人工智能 2 分鐘 1631 字 評分: 92
世界模型 因果AI 具身智能 机器人 物理AI
📌 一句话摘要 黄碧薇教授深度拆解世界模型的技术现状,提出以因果 AI 为核心的第四条路线,分享了因果世界模型如何让机器人真正理解物理规律并实现举一反三,以及她从学者到创业者的心路历程。 📝 详细摘要 本期节目深度对话 Aether AI 创始人黄碧薇教授,探讨她所押注的「因果世界模型」路线。黄教授首先为世界模型做了严谨的科普,指出当下火热的视频生成、3D 生成和 JEPA 路线均停留在相关性层面,并未真正理解物理动力学。她提出了实现世界模型的三大核心要素:在隐空间同时学习因果变量、因果结构及其状态转移动力学。以此为基点,她详细对比了 VLA(5 分)和 WAM(6.5 分)的局限性,认为

📌 一句话摘要

黄碧薇教授深度拆解世界模型的技术现状,提出以因果 AI 为核心的第四条路线,分享了因果世界模型如何让机器人真正理解物理规律并实现举一反三,以及她从学者到创业者的心路历程。

📝 详细摘要

本期节目深度对话 Aether AI 创始人黄碧薇教授,探讨她所押注的「因果世界模型」路线。黄教授首先为世界模型做了严谨的科普,指出当下火热的视频生成、3D 生成和 JEPA 路线均停留在相关性层面,并未真正理解物理动力学。她提出了实现世界模型的三大核心要素:在隐空间同时学习因果变量、因果结构及其状态转移动力学。以此为基点,她详细对比了 VLA(5 分)和 WAM(6.5 分)的局限性,认为它们的上限明显,而因果世界模型才是通往终局的十分解法。

对话涵盖了大量一手创业信息,包括 2000 万美金天使轮的融资细节、四类训练数据的 80/20 配比逻辑,以及一个令人印象深刻的案例:仅用上百小时的模拟数据,便让机器人组合学会了 Pick & Place 和 Lift 技能,并泛化到从未训练的 Stacking 任务。此外,黄教授还回顾了因果科学的学术简史,从亚里士多德的哲学思辨到 CMU 的 PC 算法,再到自己在非完美数据中挖掘因果关系的学术贡献,并分享了在 LLM 热潮下的学术反思与毅然投身具身智能创业的底层驱动力。

💡 主要观点

- 因果是世界模型实现泛化的唯一路径 黄教授认为世界模型必须在隐空间同时习得因果变量、因果结构及物理动力学,否则只是表层模仿,无法泛化。她给 VLA 打 5 分,WAM 打 6.5 分,认为它们无法解决长程任务中的物理规律理解问题。

真实世界的因果关系挖掘需处理「不完美」数据 早期因果发现依赖理想假设,但真实数据充满隐变量、偏差和分布偏移。黄教授的核心学术贡献在于,从理论和算法层面解决了在非完美观测数据中提取因果关系这一难题。
科研与创业的内在统一与创业触发点 黄教授将公司视为前沿实验室,创业动机源于观察到 VLA 路线在具身智能领域碰壁,且工厂机器人因缺乏智慧大脑被退回,这正是因果 AI 可大展拳脚的时机。

💬 文章金句

- 视频生成模型,3D 生成模型,以及加拍路线……它们还没有真正的做到理解背后的物理规律。最终的落地的世界模型,它必须是要懂我们这个物理世界底层规律因果结构。

  • 现在大家开始都转向 WAM 了,我觉得 WAM 算作一个中间态……VLA 天花板可能是比如说五分,WAM 的话可能是能够达到个六点五分,但它一定是一个中间路线,达不到我们最后想实现的目标。
  • 如果一个模型它只去死记硬背过去习得的一些技能,而没有真正理解背后的因果关系,那它会做 stacking 这个任务吗?显然是不会的。
  • 我要把学了这么多年的这个因果相关东西运用出来。机器人已经进厂打工了,但是测试了一阵子之后又被退回去了,因为他们缺了一个非常智慧大脑,我觉得那不是因果 AI 最擅长的事情吗?

📊 文章信息

AI 初评:92

来源:十字路口Crossing

作者:十字路口Crossing

分类:人工智能

语言:中文

阅读时间:67 分钟

字数:16676

标签: 世界模型, 因果AI, 具身智能, 机器人, 物理AI

收听完整播客

查看原文 → 發佈: 2026-06-19 00:00:00 收錄: 2026-06-19 02:00:54

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。