复旦大学与上海交大团队提出检索增强自动驾驶范式,通过检索当前位置的街景图、卫星图等历史地理信息,为车辆提供类似人类的空间记忆,在静态道路结构感知任务上取得显著提升。
📝 详细摘要
本文报道了复旦大学可信具身智能研究院与上海交大团队在 CVPR 2026 上发表的研究《Spatial Retrieval Augmented Autonomous Driving》。该研究提出一种新的自动驾驶范式,核心思路是让车辆不再仅依赖实时传感器输入,而是通过 GPS 检索当前位置的历史地理图像(街景图、卫星图),将其与车载相机特征融合,为模型提供额外的道路结构参考。研究团队基于 nuScenes 构建了 nuScenes-Geography 数据集,并设计了可靠性估计模块 REG 来处理街景缺失、数据过时等问题。实验结果表明,该方法在在线建图、占用预测和世界模型等静态道路结构相关任务上提升显著,例如 MapTR 的 mAP 从 50.3 提升到 61.2,MapTRv2 的 mAP 从 61.5 提升到 73.4;而在 3D 目标检测等动态目标相关任务上提升有限。研究团队认为,这项工作的意义在于打开了检索增强自动驾驶这一新方向,使自动驾驶系统从单纯实时感知转向实时感知与历史空间记忆结合。
💡 主要观点
- 提出检索增强自动驾驶范式,让车辆利用历史地理信息作为空间记忆。 通过 GPS 检索当前位置的街景图和卫星图,与实时传感器信息融合,使车辆在传感器看不清时仍能理解道路结构,类似人类驾驶的空间记忆能力。
💬 文章金句
- 车辆不应只是根据当前摄像头和传感器看到的内容做即时判断,而应具备一种可检索的空间记忆,能够调取当前位置长期积累的道路结构信息。
- Geo 不是要替代实时感知,而是要成为自动驾驶系统中的一种空间先验,让车辆在看不清当前世界时,仍然能够参考「这条路原本是什么样子」。
- 这项研究真正打开的不是某个单一指标的提升,而是一种新的自动驾驶范式:从「只依赖当前传感器」走向「实时感知 + 历史地理记忆」。
📊 文章信息
AI 初评:86
来源:AI科技评论
作者:AI科技评论
分类:人工智能
语言:中文
阅读时间:19 分钟
字数:4686
标签: 自动驾驶, 检索增强, 空间记忆, 地理信息, CVPR 2026