对话小马智行楼天城：驯服脱缰的野马，让 AI 自我进化

📌 一句话摘要

小马智行 CTO 楼天城深度解读世界模型 2.0：从依赖人类诊断到 AI 自我纠错与进化，自动驾驶正进入 AI 自我驱动的全新开发范式。

📝 详细摘要

本文是《晚点 LatePost》对小马智行 CTO 楼天城的深度专访。楼天城系统阐述了小马智行在 L4 自动驾驶技术路线上的核心思考与最新进展。他回顾了公司从 2020 年起放弃模仿学习、转向世界模型与强化学习路线的决策过程，并详细介绍了世界模型从 1.0 到 2.0 的演进：1.0 阶段通过虚拟环境训练车端模型，但诊断和反馈仍依赖人类工程师；2.0 阶段则实现了 AI 的自我诊断与自我进化，由 AI 来识别问题、驱动训练过程，大幅提升了效率与天花板。楼天城将当下的 AI 比喻为「脱缰野马」，认为最稀缺的是能驾驭 AI、为其设置框架并让其自我演进的人才。他还就 L2 与 L4 的技术路线差异、Robotaxi 的规模化挑战、AI 对组织管理的影响、以及世界模型的未来（物理世界模型乃至 AI for Science）等话题分享了独到见解。

💡 主要观点

- 小马智行从 2020 年起放弃模仿学习，转向世界模型与强化学习路线。 楼天城认为单纯依赖人类驾驶数据采集的模仿学习很快会遇瓶颈，模型需要一个能持续生成虚拟场景、评估行为并进行博弈的训练系统才能突破天花板，这套系统即世界模型。

世界模型 2.0 的核心是 AI 的自我诊断与自我进化。 1.0 阶段由人类工程师诊断问题、判断驾驶表现；2.0 阶段则将诊断和反馈工作交给 AI，由 AI 自动识别车端模型的不足并驱动训练过程，不仅效率更高，天花板也更高。

最稀缺的是能驾驭 AI 的人才，而非单纯使用 AI 的人。 楼天城将 AI 比作脱缰野马，关键在于为其打造「马鞍」——即设置框架、分解任务、构建系统，让 AI 在框架内自我演进。这种驾驭能力需要在没有 AI 的时代训练出来。

L4 与 L2 的技术路线本质不同，L2 的积累不会帮助做 L4。 L4 追求绝对安全，优先保证足够安全而非控制成本；L2 则允许用户接管。楼天城认为想做 L4 就必须从零开始走世界模型路线，L2 领域的积累对 L4 没有帮助。

世界模型的未来是物理世界模型，甚至可能触及 AI for Science。 楼天城设想世界模型第三阶段将扩展到宏观物理世界（如机器人训练）和微观物理世界（如模拟量子干涉），帮助理解真实世界如何存在与运转。

💬 文章金句

- 想做 L4，大家就都要从 0 开始做，或者说再走一遍我们走过的路。

完成 AI 交给你的任务。
AI 是脱缰野马，打造一副马鞍驾驭它，让它自己演化。
AI 用的好不好的人之间，原来差距可能是 120% 到 180% 的区别，但今天可能是 100 倍和负 200 倍的差别，差距在拉大。
这可能是人类这么多年充分利用 AI 后，我们这代人类能做的最大贡献之一。

📊 文章信息

AI 初评：88

来源：晚点LatePost

作者：晚点LatePost

分类：人工智能

语言：中文

阅读时间：49 分钟

字数：12007

标签：自动驾驶, 世界模型, 强化学习, 小马智行, L4 Robotaxi

阅读完整文章

对话小马智行楼天城：驯服脱缰的野马，让 AI 自我进化

🤖 問 AI