← 回總覽

对话小马智行楼天城:驯服脱缰的野马,让 AI 自我进化

📅 2026-04-25 22:43 晚点LatePost 人工智能 2 分鐘 1567 字 評分: 88
自动驾驶 世界模型 强化学习 小马智行 L4 Robotaxi
📌 一句话摘要 小马智行 CTO 楼天城深度解读世界模型 2.0:从依赖人类诊断到 AI 自我纠错与进化,自动驾驶正进入 AI 自我驱动的全新开发范式。 📝 详细摘要 本文是《晚点 LatePost》对小马智行 CTO 楼天城的深度专访。楼天城系统阐述了小马智行在 L4 自动驾驶技术路线上的核心思考与最新进展。他回顾了公司从 2020 年起放弃模仿学习、转向世界模型与强化学习路线的决策过程,并详细介绍了世界模型从 1.0 到 2.0 的演进:1.0 阶段通过虚拟环境训练车端模型,但诊断和反馈仍依赖人类工程师;2.0 阶段则实现了 AI 的自我诊断与自我进化,由 AI 来识别问题、驱动训练过

📌 一句话摘要

小马智行 CTO 楼天城深度解读世界模型 2.0:从依赖人类诊断到 AI 自我纠错与进化,自动驾驶正进入 AI 自我驱动的全新开发范式。

📝 详细摘要

本文是《晚点 LatePost》对小马智行 CTO 楼天城的深度专访。楼天城系统阐述了小马智行在 L4 自动驾驶技术路线上的核心思考与最新进展。他回顾了公司从 2020 年起放弃模仿学习、转向世界模型与强化学习路线的决策过程,并详细介绍了世界模型从 1.0 到 2.0 的演进:1.0 阶段通过虚拟环境训练车端模型,但诊断和反馈仍依赖人类工程师;2.0 阶段则实现了 AI 的自我诊断与自我进化,由 AI 来识别问题、驱动训练过程,大幅提升了效率与天花板。楼天城将当下的 AI 比喻为「脱缰野马」,认为最稀缺的是能驾驭 AI、为其设置框架并让其自我演进的人才。他还就 L2 与 L4 的技术路线差异、Robotaxi 的规模化挑战、AI 对组织管理的影响、以及世界模型的未来(物理世界模型乃至 AI for Science)等话题分享了独到见解。

💡 主要观点

- 小马智行从 2020 年起放弃模仿学习,转向世界模型与强化学习路线。 楼天城认为单纯依赖人类驾驶数据采集的模仿学习很快会遇瓶颈,模型需要一个能持续生成虚拟场景、评估行为并进行博弈的训练系统才能突破天花板,这套系统即世界模型。

世界模型 2.0 的核心是 AI 的自我诊断与自我进化。 1.0 阶段由人类工程师诊断问题、判断驾驶表现;2.0 阶段则将诊断和反馈工作交给 AI,由 AI 自动识别车端模型的不足并驱动训练过程,不仅效率更高,天花板也更高。
最稀缺的是能驾驭 AI 的人才,而非单纯使用 AI 的人。 楼天城将 AI 比作脱缰野马,关键在于为其打造「马鞍」——即设置框架、分解任务、构建系统,让 AI 在框架内自我演进。这种驾驭能力需要在没有 AI 的时代训练出来。
L4 与 L2 的技术路线本质不同,L2 的积累不会帮助做 L4。 L4 追求绝对安全,优先保证足够安全而非控制成本;L2 则允许用户接管。楼天城认为想做 L4 就必须从零开始走世界模型路线,L2 领域的积累对 L4 没有帮助。
世界模型的未来是物理世界模型,甚至可能触及 AI for Science。 楼天城设想世界模型第三阶段将扩展到宏观物理世界(如机器人训练)和微观物理世界(如模拟量子干涉),帮助理解真实世界如何存在与运转。

💬 文章金句

- 想做 L4,大家就都要从 0 开始做,或者说再走一遍我们走过的路。

  • 完成 AI 交给你的任务。
  • AI 是脱缰野马,打造一副马鞍驾驭它,让它自己演化。
  • AI 用的好不好的人之间,原来差距可能是 120% 到 180% 的区别,但今天可能是 100 倍和负 200 倍的差别,差距在拉大。
  • 这可能是人类这么多年充分利用 AI 后,我们这代人类能做的最大贡献之一。

📊 文章信息

AI 初评:88

来源:晚点LatePost

作者: 晚点LatePost

分类:人工智能

语言:中文

阅读时间:49 分钟

字数:12007

标签: 自动驾驶, 世界模型, 强化学习, 小马智行, L4 Robotaxi

阅读完整文章

查看原文 → 發佈: 2026-04-25 22:43:00 收錄: 2026-04-26 22:00:36

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。