← 回總覽

复旦可信具身智能研究院&上海交大:给自动驾驶装上可检索的「空间记忆」丨 CVPR 2026

📅 2026-05-19 18:00 AI科技评论 人工智能 2 分鐘 1598 字 評分: 86
自动驾驶 检索增强 空间记忆 地理信息 CVPR 2026
📌 一句话摘要 复旦大学与上海交大团队提出检索增强自动驾驶范式,通过检索当前位置的街景图、卫星图等历史地理信息,为车辆提供类似人类的空间记忆,在静态道路结构感知任务上取得显著提升。 📝 详细摘要 本文报道了复旦大学可信具身智能研究院与上海交大团队在 CVPR 2026 上发表的研究《Spatial Retrieval Augmented Autonomous Driving》。该研究提出一种新的自动驾驶范式,核心思路是让车辆不再仅依赖实时传感器输入,而是通过 GPS 检索当前位置的历史地理图像(街景图、卫星图),将其与车载相机特征融合,为模型提供额外的道路结构参考。研究团队基于 nuSce

📌 一句话摘要

复旦大学与上海交大团队提出检索增强自动驾驶范式,通过检索当前位置的街景图、卫星图等历史地理信息,为车辆提供类似人类的空间记忆,在静态道路结构感知任务上取得显著提升。

📝 详细摘要

本文报道了复旦大学可信具身智能研究院与上海交大团队在 CVPR 2026 上发表的研究《Spatial Retrieval Augmented Autonomous Driving》。该研究提出一种新的自动驾驶范式,核心思路是让车辆不再仅依赖实时传感器输入,而是通过 GPS 检索当前位置的历史地理图像(街景图、卫星图),将其与车载相机特征融合,为模型提供额外的道路结构参考。研究团队基于 nuScenes 构建了 nuScenes-Geography 数据集,并设计了可靠性估计模块 REG 来处理街景缺失、数据过时等问题。实验结果表明,该方法在在线建图、占用预测和世界模型等静态道路结构相关任务上提升显著,例如 MapTR 的 mAP 从 50.3 提升到 61.2,MapTRv2 的 mAP 从 61.5 提升到 73.4;而在 3D 目标检测等动态目标相关任务上提升有限。研究团队认为,这项工作的意义在于打开了检索增强自动驾驶这一新方向,使自动驾驶系统从单纯实时感知转向实时感知与历史空间记忆结合。

💡 主要观点

- 提出检索增强自动驾驶范式,让车辆利用历史地理信息作为空间记忆。 通过 GPS 检索当前位置的街景图和卫星图,与实时传感器信息融合,使车辆在传感器看不清时仍能理解道路结构,类似人类驾驶的空间记忆能力。

地理图像对静态道路结构任务提升显著,对动态目标任务帮助有限。 在线建图任务中 MapTR 的 mAP 提升 10.9 个点,而 3D 目标检测的 mAP 仅提升 0.04 个点,说明地理信息更适合作为空间结构参考而非实时感知替代。
设计可靠性估计模块 REG 处理地理图像不可靠的情况。 针对街景缺失、数据过时、GPS 误差等问题,通过评估视觉相似性和地理位置匹配度,动态决定模型对地理信息的依赖程度,提升系统稳定性。
构建 nuScenes-Geography 数据集并优化数据存储策略。 基于 nuScenes 扩展,通过全景图合成和视角重投影技术,相比逐帧下载节省超过 70% 存储空间,同时保持 92% 以上的数据覆盖率。

💬 文章金句

- 车辆不应只是根据当前摄像头和传感器看到的内容做即时判断,而应具备一种可检索的空间记忆,能够调取当前位置长期积累的道路结构信息。

  • Geo 不是要替代实时感知,而是要成为自动驾驶系统中的一种空间先验,让车辆在看不清当前世界时,仍然能够参考「这条路原本是什么样子」。
  • 这项研究真正打开的不是某个单一指标的提升,而是一种新的自动驾驶范式:从「只依赖当前传感器」走向「实时感知 + 历史地理记忆」。

📊 文章信息

AI 初评:86

来源:AI科技评论

作者:AI科技评论

分类:人工智能

语言:中文

阅读时间:19 分钟

字数:4686

标签: 自动驾驶, 检索增强, 空间记忆, 地理信息, CVPR 2026

阅读完整文章

查看原文 → 發佈: 2026-05-19 18:00:00 收錄: 2026-05-20 02:00:05

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。