CVPR 2026，英伟达特斯拉 Waymo 一块听中国公司讲物理 AI

📌 一句话摘要

小鹏在 CVPR 2026 首次完整展示世界模型技术图谱，提出 VLA 与世界模型协同进化的物理 AI 基座路线，并公开量产验证数据。

📝 详细摘要

本文报道小鹏汽车在 CVPR 2026「具身智能基座模型部署研讨会」上的技术分享。小鹏通用智能中心负责人刘先明系统阐述了其物理 AI 技术路线：将第二代 VLA（视觉-语言-动作）与世界模型并行演进，通过稀疏的人类意图信号与密集的物理状态预测协同训练，使模型同时理解「如何行动」与「行动后世界如何变化」。文章详细介绍了近期论文成果：X-World（可控多视角视频生成式世界模型）、X-Foresight（视觉-动作因果预测网络）、X-Cache（推理加速缓存机制），并预告了可解释性论文 X-mind。在工程落地层面，小鹏公布了第二代 VLA 的量产数据：首月辅助驾驶里程占比突破 50%，车端模型推理速度提升 12 倍，自研芯片+模型组合将算力利用率从 22.8% 提升至 82.5%，推理时延压缩至 80 毫秒。文章指出，小鹏的技术路线已超越自动驾驶范畴，具备向人形机器人等物理世界应用跨域迁移的潜力。

💡 主要观点

- 小鹏提出 VLA 与世界模型协同进化的物理 AI 基座路线。 VLA 学习人类行为意图（稀疏监督），世界模型通过密集的下一帧预测学习物理动力学与因果结构，二者在统一 token 空间内联合训练，终结了行业「二选一」的路线之争。

小鹏世界模型技术栈已形成完整体系，并投入量产验证。 X-World 用于闭环仿真与数据生成，X-Foresight 为 VLA 提供预测式决策支撑，X-Cache 实现 2.7 倍推理加速。第二代 VLA 首月辅助驾驶里程占比超 50%，验证了规模化落地的可行性。

自研芯片与模型深度协同是性能突破的关键。 小鹏图灵芯片 + 第二代 VLA 的组合将算力利用率从通用方案的 22.8% 提升至 82.5%，推理时延从 800ms 压缩至 80ms，体现了软硬件垂直整合的竞争力。

小鹏的技术路线具备跨域迁移能力，从自动驾驶延伸至通用物理世界认知。 世界模型的核心是理解动态物理世界，而非仅解决驾驶任务，因此可自然迁移至人形机器人、飞行汽车等场景，使小鹏从「造车新势力」转向「物理 AI 公司」。

💬 文章金句

- 小鹏物理世界基座模型，既是第二代 VLA，也是世界模型。

AI 如果真的要在物理世界中行动，需要知道几件事：一是「如何行动」，二是理解「行动之后世界会如何变化」。
小鹏的世界模型并不是在教 AI 开车，而是在教 AI「看懂」物理世界——开车只是其中一种具体的「懂法」。

📊 文章信息

AI 初评：84

来源：量子位

作者：贾浩楠

分类：商业科技

语言：中文

阅读时间：18 分钟

字数：4300

标签：自动驾驶, 物理 AI, 世界模型, VLA, 小鹏

阅读完整文章

CVPR 2026，英伟达特斯拉 Waymo 一块听中国公司讲物理 AI

🤖 問 AI