← 回總覽

CVPR 2026,英伟达特斯拉 Waymo 一块听中国公司讲物理 AI

📅 2026-06-04 19:56 贾浩楠 商业科技 2 分鐘 1505 字 評分: 84
自动驾驶 物理 AI 世界模型 VLA 小鹏
📌 一句话摘要 小鹏在 CVPR 2026 首次完整展示世界模型技术图谱,提出 VLA 与世界模型协同进化的物理 AI 基座路线,并公开量产验证数据。 📝 详细摘要 本文报道小鹏汽车在 CVPR 2026「具身智能基座模型部署研讨会」上的技术分享。小鹏通用智能中心负责人刘先明系统阐述了其物理 AI 技术路线:将第二代 VLA(视觉-语言-动作)与世界模型并行演进,通过稀疏的人类意图信号与密集的物理状态预测协同训练,使模型同时理解「如何行动」与「行动后世界如何变化」。文章详细介绍了近期论文成果:X-World(可控多视角视频生成式世界模型)、X-Foresight(视觉-动作因果预测网络)、

📌 一句话摘要

小鹏在 CVPR 2026 首次完整展示世界模型技术图谱,提出 VLA 与世界模型协同进化的物理 AI 基座路线,并公开量产验证数据。

📝 详细摘要

本文报道小鹏汽车在 CVPR 2026「具身智能基座模型部署研讨会」上的技术分享。小鹏通用智能中心负责人刘先明系统阐述了其物理 AI 技术路线:将第二代 VLA(视觉-语言-动作)与世界模型并行演进,通过稀疏的人类意图信号与密集的物理状态预测协同训练,使模型同时理解「如何行动」与「行动后世界如何变化」。文章详细介绍了近期论文成果:X-World(可控多视角视频生成式世界模型)、X-Foresight(视觉-动作因果预测网络)、X-Cache(推理加速缓存机制),并预告了可解释性论文 X-mind。在工程落地层面,小鹏公布了第二代 VLA 的量产数据:首月辅助驾驶里程占比突破 50%,车端模型推理速度提升 12 倍,自研芯片+模型组合将算力利用率从 22.8% 提升至 82.5%,推理时延压缩至 80 毫秒。文章指出,小鹏的技术路线已超越自动驾驶范畴,具备向人形机器人等物理世界应用跨域迁移的潜力。

💡 主要观点

- 小鹏提出 VLA 与世界模型协同进化的物理 AI 基座路线。 VLA 学习人类行为意图(稀疏监督),世界模型通过密集的下一帧预测学习物理动力学与因果结构,二者在统一 token 空间内联合训练,终结了行业「二选一」的路线之争。

小鹏世界模型技术栈已形成完整体系,并投入量产验证。 X-World 用于闭环仿真与数据生成,X-Foresight 为 VLA 提供预测式决策支撑,X-Cache 实现 2.7 倍推理加速。第二代 VLA 首月辅助驾驶里程占比超 50%,验证了规模化落地的可行性。
自研芯片与模型深度协同是性能突破的关键。 小鹏图灵芯片 + 第二代 VLA 的组合将算力利用率从通用方案的 22.8% 提升至 82.5%,推理时延从 800ms 压缩至 80ms,体现了软硬件垂直整合的竞争力。
小鹏的技术路线具备跨域迁移能力,从自动驾驶延伸至通用物理世界认知。 世界模型的核心是理解动态物理世界,而非仅解决驾驶任务,因此可自然迁移至人形机器人、飞行汽车等场景,使小鹏从「造车新势力」转向「物理 AI 公司」。

💬 文章金句

- 小鹏物理世界基座模型,既是第二代 VLA,也是世界模型。

  • AI 如果真的要在物理世界中行动,需要知道几件事:一是「如何行动」,二是理解「行动之后世界会如何变化」。
  • 小鹏的世界模型并不是在教 AI 开车,而是在教 AI「看懂」物理世界——开车只是其中一种具体的「懂法」。

📊 文章信息

AI 初评:84

来源:量子位

作者:贾浩楠

分类:商业科技

语言:中文

阅读时间:18 分钟

字数:4300

标签: 自动驾驶, 物理 AI, 世界模型, VLA, 小鹏

阅读完整文章

查看原文 → 發佈: 2026-06-04 19:56:35 收錄: 2026-06-05 00:00:18

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。