小鹏在 CVPR 2026 首次完整展示世界模型技术图谱,提出 VLA 与世界模型协同进化的物理 AI 基座路线,并公开量产验证数据。
📝 详细摘要
本文报道小鹏汽车在 CVPR 2026「具身智能基座模型部署研讨会」上的技术分享。小鹏通用智能中心负责人刘先明系统阐述了其物理 AI 技术路线:将第二代 VLA(视觉-语言-动作)与世界模型并行演进,通过稀疏的人类意图信号与密集的物理状态预测协同训练,使模型同时理解「如何行动」与「行动后世界如何变化」。文章详细介绍了近期论文成果:X-World(可控多视角视频生成式世界模型)、X-Foresight(视觉-动作因果预测网络)、X-Cache(推理加速缓存机制),并预告了可解释性论文 X-mind。在工程落地层面,小鹏公布了第二代 VLA 的量产数据:首月辅助驾驶里程占比突破 50%,车端模型推理速度提升 12 倍,自研芯片+模型组合将算力利用率从 22.8% 提升至 82.5%,推理时延压缩至 80 毫秒。文章指出,小鹏的技术路线已超越自动驾驶范畴,具备向人形机器人等物理世界应用跨域迁移的潜力。
💡 主要观点
- 小鹏提出 VLA 与世界模型协同进化的物理 AI 基座路线。 VLA 学习人类行为意图(稀疏监督),世界模型通过密集的下一帧预测学习物理动力学与因果结构,二者在统一 token 空间内联合训练,终结了行业「二选一」的路线之争。
💬 文章金句
- 小鹏物理世界基座模型,既是第二代 VLA,也是世界模型。
- AI 如果真的要在物理世界中行动,需要知道几件事:一是「如何行动」,二是理解「行动之后世界会如何变化」。
- 小鹏的世界模型并不是在教 AI 开车,而是在教 AI「看懂」物理世界——开车只是其中一种具体的「懂法」。
📊 文章信息
AI 初评:84
来源:量子位
作者:贾浩楠
分类:商业科技
语言:中文
阅读时间:18 分钟
字数:4300
标签: 自动驾驶, 物理 AI, 世界模型, VLA, 小鹏