IEEE综述 | 车道拓扑推理20年演进:从程序化建模到车载传感器
导读
车道拓扑推理对于高精建图和自动驾驶应用至关重要,从早期的程序化建模方法发展到基于车载传感器的方法,但是很少有工作对车道拓扑推理技术进行全面概述。为此,本文系统性地调研了车道拓扑推理技术,同时确定了未来研究的挑战和机遇,旨在为研究者和从业者提供对这一快速发展领域的宝贵见解。
©️【深蓝AI】编译
本文由paper作者——Miao Fan授权【深蓝AI】编译发布!
论文题目:A Concise Survey on Lane Topology Reasoning for HD Mapping
论文作者:Yi Yao, Miao Fan, Shengtong Xu, Haoyi Xiong, Xiangzeng Liu, Wenbo Hu, Wenbing Huang
论文地址:https://arxiv.org/abs/2504.01989
1、摘要
车道拓扑推理技术在高精(HD)建图和自动驾驶应用中发挥着至关重要的作用。虽然近年来在该领域中取得了重大进展,但是很少有文献综合概述这些工作。本项调研系统性地回顾了车道拓扑推理方法的演变和现状,将其分为三种主要范式:基于程序化建模的方法、基于航拍图像的方法和基于车载传感器的方法。本文分析了从早期基于规则的方法到现代基于学习的解决方案的进展,这些基于学习的解决方案利用了transformers、图神经网络(GNNs)和其它深度学习架构。本文研究了标准化的评估指标,包括道路级指标(APLS和TLTS评分)和车道级指标(DET和TOP评分),以及在OpenLane-V2等基准数据集上的性能比较。本文确定了关键的技术挑战,包括数据集可用性和模型效率,并且总结了未来研究中有前景的方向。这篇综述为研究者和从业者提供了对高精建图应用中车道拓扑推理的理论框架、实际实现和新兴趋势的见解。
2、介绍
高精(HD)地图是自动驾驶的基础,它提供了道路网络、车道配置和交通元素的详细表示。在高精建图的各方面中,车道拓扑推理(理解不同车道如何相互连接和关联(见图3))对于安全且高效的自主导航尤为重要。在过去的二十年里,该领域发生了重大的演变,从简单的基于规则的方法发展到复杂的深度学习方法。
图3|交叉路口处车道拓扑的示意图
车道拓扑推理方法的发展大致可分为三种主要范式。早期的方法依赖于程序化建模技术,利用计算机图形学和基于规则的系统来生成道路网络。这些方法较为基础,它们依赖于人工设计的规则并且缺乏灵活性,因此受到限制。基于航拍图像方法的出现标志着一项重大转变,它引入了计算机视觉技术从俯视图中提取道路拓扑结构。然而,这些方法往往难以解决由建筑物和树木造成的遮挡问题,它们只能提取粗略的道路级网络。近年来,已经见证了基于车载传感器方法的出现(见图1),这代表着车道拓扑推理领域的最新进展。
图1|高精(HD)建图的车道拓扑推理图示
这些方法利用了深度学习架构,它们通常由几个关键组件组成:用于特征提取的主干网络(例如ResNet或者Swin Transformer)、用于鸟瞰图转换的透视变换、车道中心线检测和拓扑推理模块。现代方法通常结合多种输入模态,包括相机、激光雷达和现有的SD地图,以提高性能。基于transformer的架构和图神经网络(GNNs)的引入进一步推动了该领域的发展,实现了更复杂的拓扑推理能力。
现有的研究详细介绍了高精地图创建和车道拓扑构建,但是它们缺乏对最新研究的系统性介绍。本篇综述全面回顾了车道拓扑推理方法,分析了它们的演变、能力和局限性。本文研究了该领域中使用的不同评估指标,包括道路级指标和车道级指标,并且比较了各种方法在标准基准上的性能。此外,本文还讨论了当前的挑战,并且确定了未来研究中有前景的方向,旨在为研究者和从业者提供对这一快速发展领域的宝贵见解。
3、方法回顾
本节回顾了2024年之前发表的具有代表性的车道拓扑推理方法。如图2所示,这些方法根据其发展范式分为三类。
图2|2001年至2024年车道拓扑推理研究的演变,展示了该领域的方法进展和技术转型。时间线跟踪了三种不同的方法:基于程序化建模的方法(蓝色箭头)、基于航拍图像的方法(绿色箭头)和基于车载传感器的方法(橙色箭头)
程序化建模在2017年之前就已经盛行,基于航拍图像的方法在2017年至2022年期间获得了主流地位。自2023年以来,基于车载传感器的解决方案变得越来越普遍。
3.1 基于程序化建模的方法
车道拓扑推理的早期探索主要采用计算机建模技术来模拟城市道路网络,其主要优点是数据放大能力强。这些方法的工作流程如图4所示。
图4|基于程序化建模方法的流程
在输入城市的2D图像地图(例如地理地图和统计地图)后,这些方法生成了包含建筑物、道路网络和其它城市特征的虚拟城市地图。交互式参数调整使得用户能够根据特定要求来优化结果。
Parish等人提出了将L-system应用于生成城市道路网络的开创性工作,这一概念在后续研究中得到了进一步扩展。Chen等人引入了张量场表示来建模道路几何形状。随后的改进引入了额外的约束和功能。地形感知方法确保了地理一致性,而智能仿真技术增强了交通建模的真实性。此外,基于草图的方法实现了直观的用户交互,示例驱动的方法利用预先存在的数据来加快道路网络生成。
3.2 基于航拍图像的方法
尽管基于程序化建模的方法是该领域的基础,但是这些方法的可控性仍然有限,并且严重依赖于人工设计的规则。此外,评估这些规则和参数对最终输出的影响本身具有挑战性,这需要大量的迭代实验来获得令人满意的结果。因此,这些方法缺乏灵活性。相比之下,深度学习的兴起通过从航拍图像中直接提取道路拓扑结构,从而彻底改变了高精建图技术。这些方法利用了神经网络,这最大限度地减少了人工干预,并且简化了建图过程。这些方法的一般工作流程如图5所示。
图5|基于航拍图像方法的流程
一些方法利用语义分割网络来识别航拍图像中的道路区域,然后进行形态学后处理以提取道路拓扑。替代方法包括迭代图构造和图生长方法。迭代图构造方法通过从道路网络中识别几个顶点,并且根据预定义的决策函数迭代地添加新的顶点和边来逐步扩展图。相比之下,图生成方法更为直接。这些方法采用矢量场编码策略,它们首先将航拍图像编码为潜在表示。神经网络随后用于预测图顶点,然后解码过程预测邻接矩阵并且重建道路网络。
3.3 基于车载传感器的方法
尽管基于航拍图像的方法为该领域引入了新的方法,但是它们仅限于提取粗略的道路级网络。此外,建筑物和树木造成的遮挡往往会使道路在航拍图像中不完整,从而影响结果的准确性。因此,这些方法不适合自动构建高精地图或者为自动驾驶汽车规划行为。为了解决这些局限性,基于车载传感器的方法逐渐兴起,它们利用从车载传感器捕获的单模态或者多模态数据来构建自车周围的详细车道拓扑。这些方法代表了高精建图的重大转变,它们提供了更高的准确性和适用性。图6展示了基于车载传感器方法的典型流程,包括主干网络、透视变换、车道解码器和拓扑解码器。
图6|基于车载传感器方法的流程
主干部分通常由特征提取网络组成,例如ResNet和Swin Transformer。然后,透视变换将这些特征转换为鸟瞰图(BEV)格式。在获得BEV特征后,通常使用基于transformer的架构来设计车道中心线解码器,以根据信息要求输出车道中心线特征。在这部分中,通常使用一组学习到的查询向量来映射不同的中心线实例。拓扑解码器的功能是在这些车道中心线实例之间建立连接,通常使用GNNs、MLPs和语言模型。除了车载相机图像外,一些方法还使用补充数据源来增强输入特征,包括SD地图、激光雷达点云和交通元素(例如交通信号灯和交通标志牌),从而提高了性能。
Can等人提出了首批工作之一,他们使用来自前视相机的单帧图像作为输入并且采用类似于DETR的基于transformer的架构来预测中心线实例。该方法使用额外的MLPs来输出中心线实例的连接关系。同样,另一些方法也使用一组MLPs来预测拓扑关系。在先前工作的基础上,Can等人引入了最小环的概念,并且准确估计了交叉路口区域的车道连接关系。LaneGAP通过采用Path2Graph算法来恢复拓扑关系,从而进一步改进了拓扑估计。HDMapGen仅使用基于图的模型来自回归地生成车道拓扑。一些解决方案首先检测车道中心线,并且将每条车道中心线映射到顶点,然后使用基于图的模型来更新车道拓扑。此外,另一些方法对车道中心线特征进行序列化,并且使用语言模型来建立拓扑关系。
3.4 其它方法
尽管本项调研着重于上述三种方法类型,但是也存在其它重要的方法。例如,Jia等人根据现有高精地图中的车道线和道路边界来生成车道拓扑;He等人和Stanojevic等人从GPS轨迹中提取车道拓扑。
4、数据集和基准
本节列出了上述方法中常用的数据集。此外,本文还研究了该领域中使用的不同评估指标,并且比较了各种方法在基准数据集上的性能。
4.1 数据集
相关数据集可以分为2D数据集和3D数据集。表格1总结了这些数据集,它们通过提供针对特定研究需求而设计的多样化且高质量的数据,在推进道路拓扑提取和车道拓扑推理方面发挥关键作用。
表格1|当前相关数据集的比较
1)2D数据集:为了从航拍图像中提取道路拓扑结构,已经使用了几个2D数据集,包括SpaceNet、DeepGlobe和Topo-boundary。SpaceNet是一个包含建筑和道路网络标注的大规模数据集,它广泛应用于城市拓扑提取任务。DeepGlobe专注于具有不同土地覆盖类型的乡村地区,该数据集提供了高密度的道路网络标注,使其适用于需要在非城市环境中进行建图的任务。Topo-boundary是专门为离线拓扑道路边界检测而设计的。
2)3D数据集:nuScenes、Argoverse2和OpenLane-V2是基于车载传感器的方法中使用的重要数据集。nuScenes和Argoverse2都由来自高分辨率车载传感器(包括相机和激光雷达)的数据组成。OpenLane-V2是专门为车道拓扑推理任务而设计的独特3D数据集,它分为两个子集:subset_A和subset_B,分别来自Argoverse2和nuScenes。这些子集确保了全面覆盖与车道拓扑推理相关的场景。
4.2 评估指标
三个像素级指标(精度、召回率和F1评分)和两个拓扑级指标(APLS评分和TLTS评分)是基于航拍图像的方法中常用的道路级指标。此外,车道级指标(例如感知指标(DETl评分)和推理指标(TOPll评分))在基于车载传感器的方法中广泛应用于车道中心线之间的拓扑结构。基于程序化建模的方法缺乏一致的评估指标,因此这里不讨论它们。
4.3 比较结果
表格2展示了三种基于航拍图像的方法(基于分割、迭代图构建和图生长)在Topo-boundary数据集上的定量结果。
表格2|最先进的基于航拍图像的方法在Topo-boundary数据集上的性能比较
表格3展示了基于车载传感器的方法在OpenLane-V2数据集上的定量结果。
表格3|最先进的基于车载传感器的方法在OpenLane-V2数据集上的性能比较
5、挑战
尽管在高精建图的车道拓扑推理方面取得了重大进展,但是仍然存在若干项挑战有待解决:(1)专用于车道拓扑推理的数据集构建受到高成本的阻碍,这限制了大规模、高质量数据集的可用性。因此,需要更多的研究工作来开发针对车道拓扑推理的可获取且鲁棒的数据集。(2)尽管基于车载传感器的方法代表了最新技术,但是它们通常涉及具有大型参数规模的模型。这限制了它们在自动驾驶汽车或者边缘设备上的直接部署,这些设备具有严格的计算和能量限制。因此,开发能够实时构建高精地图的轻量级模型是至关重要的。(3)用于车道拓扑推理的路侧和车载相机数据融合仍然没有得到充分探索。与车载相机不同,路侧传感器(例如道路视频监控)为高精建图提供了一个互补的视角,缓解了周围车辆的遮挡问题,并且提高了准确性。然而,关于这一领域的研究文献有限,因此需要进一步研究。
6、总结
车道拓扑推理技术已经成为高精建图和自动驾驶应用中的关键组成部分,从早期的程序化建模阶段快速发展成现代的基于车载传感器的方法。本篇综述对这一进展进行了全面分析,突出了取得的重大进展,同时确定了未来研究中的挑战和机遇。现代技术在捕获复杂的车道拓扑方面展现出卓越的性能。各种数据源(包括相机图像、激光雷达点云和现有的SD地图)的集成进一步提高了这些系统的鲁棒性和准确性。然而,一些关键挑战依然存在。大规模、高质量数据集的可用性受限继续制约着模型的开发和验证。此外,当前架构的计算需求对资源受限环境中的实时应用提出了挑战。对于该领域中的未来研究,一个有前景的方向是通过采用路侧基础设施辅助的车辆感知技术来构建车道拓扑。