小马智行 CTO 楼天城深度解读世界模型 2.0:从依赖人类诊断到 AI 自我纠错与进化,自动驾驶正进入 AI 自我驱动的全新开发范式。
📝 详细摘要
本文是《晚点 LatePost》对小马智行 CTO 楼天城的深度专访。楼天城系统阐述了小马智行在 L4 自动驾驶技术路线上的核心思考与最新进展。他回顾了公司从 2020 年起放弃模仿学习、转向世界模型与强化学习路线的决策过程,并详细介绍了世界模型从 1.0 到 2.0 的演进:1.0 阶段通过虚拟环境训练车端模型,但诊断和反馈仍依赖人类工程师;2.0 阶段则实现了 AI 的自我诊断与自我进化,由 AI 来识别问题、驱动训练过程,大幅提升了效率与天花板。楼天城将当下的 AI 比喻为「脱缰野马」,认为最稀缺的是能驾驭 AI、为其设置框架并让其自我演进的人才。他还就 L2 与 L4 的技术路线差异、Robotaxi 的规模化挑战、AI 对组织管理的影响、以及世界模型的未来(物理世界模型乃至 AI for Science)等话题分享了独到见解。
💡 主要观点
- 小马智行从 2020 年起放弃模仿学习,转向世界模型与强化学习路线。 楼天城认为单纯依赖人类驾驶数据采集的模仿学习很快会遇瓶颈,模型需要一个能持续生成虚拟场景、评估行为并进行博弈的训练系统才能突破天花板,这套系统即世界模型。
💬 文章金句
- 想做 L4,大家就都要从 0 开始做,或者说再走一遍我们走过的路。
- 完成 AI 交给你的任务。
- AI 是脱缰野马,打造一副马鞍驾驭它,让它自己演化。
- AI 用的好不好的人之间,原来差距可能是 120% 到 180% 的区别,但今天可能是 100 倍和负 200 倍的差别,差距在拉大。
- 这可能是人类这么多年充分利用 AI 后,我们这代人类能做的最大贡献之一。
📊 文章信息
AI 初评:88
来源:晚点LatePost
作者: 晚点LatePost
分类:人工智能
语言:中文
阅读时间:49 分钟
字数:12007
标签: 自动驾驶, 世界模型, 强化学习, 小马智行, L4 Robotaxi