发新帖我要提问
12
返回列表
打印

BEV-LaneDet:一个简单有效的3D车道检测基线(论文翻译)

[复制链接]
楼主: keer_zu
手机看帖
扫描二维码
随时随地手机跟帖
21
keer_zu|  楼主 | 2023-8-1 14:01 | 只看该作者 |只看大图 回帖奖励 |倒序浏览
4.1 评估指标和实现细节

在这两个3D数据集上,我们采用了来自Gen-LaneNet[9]的评估指标,其中包括不同场景的F-Score和不同区域的X/Z误差。


4.2 OpenLane的结果


OpenLane包含150,000个训练帧和40,000个测试帧。为了验证模型在每个场景下的性能,我们将Up&Down case、Curve case、Extreme Weather case、Intersection case、Merge&Split case和Night case从验证集中分离出来。表1给出了模型在每个场景下的F-Score。我们的模型在训练集中训练了10个epoch,并为每个场景实现了最先进的性能。表2显示了不同方法在f分数和X/Z误差方面的具体性能。在F-Score方面,我们的结果比最先进的作品[3]高出10.6%。详细的可视化可以在附录中找到。此外,由于OpenLane的三维地面真值是由LiDAR合成的,因此我们的工作在X误差上并没有显示出太大的优势。然而,我们的工作显示了阿波罗数据集在X误差方面的巨大优势[9]。

使用特权

评论回复
22
keer_zu|  楼主 | 2023-8-1 14:03 | 只看该作者
本帖最后由 keer_zu 于 2023-8-1 14:05 编辑


使用特权

评论回复
23
keer_zu|  楼主 | 2023-8-1 14:10 | 只看该作者

4.3. 阿波罗3D合成的结果


Apollo数据集[9]包括10500帧离散的单目RGB图像及其对应的3D车道地面真相,分为三个场景:平衡场景、很少观察场景和视觉变化场景。每个场景包含独立的训练集和测试集。值得注意的是,阿波罗并没有提供相机的具体外部参数。我们通过数据集提供的相机高度和俯仰来计算相机的外在参数。在表3中,我们对以前的工作和我们的工作进行了比较。我们的模型在这些数据集上训练了80个epoch。我们工作的F-Score和X误差都达到了阿波罗项目的最高水平。然而,由于我们的工作更多地集中在BEV平面上,我们的工作在Z误差方面表现不佳。我们将在未来改进这个缺点。


使用特权

评论回复
24
keer_zu|  楼主 | 2023-8-1 14:13 | 只看该作者

4.4.  消融实验

本节的实验将在OpenLane上进行,评估指标仍基于Gen-LaneNet[9]。我们的基线使用ResNet34作为主干,没有虚拟摄像机(VC), VRM[21]作为空间转换模块,3D车道的偏移和网格大小为0.2的关键点表示(KPR),没有2D辅助监督。我们通过增加VC、空间变换金字塔(STP)和二维辅助监督三个模块来证明我们方法的有效性。如表4所示。此外,该表显示了将KPR中的单元格大小从0.2更改为0.5的效果,我们将在下面的实验中详细讨论这一点。同时,我们演示了不同主干在特斯拉- v100上运行的速度。同时,为了验证偏移量和网格单元大小对KPR的影响,我们添加了表5。在没有偏移的实验中,F-Score随着细胞大小的增加而增加。但是,随着单元格大小的增加,X误差也会增加。添加偏移量后,X错误返回到大单元格的正常水平。同时,单元尺寸越大,FLOPs越小。实验结果表明,该模型在网格单元尺寸为0.5 × 0.5 m2时达到最佳度量。此外,我们在表6中探讨了前视图特征层的位置对视图关系模块的影响[21]。实验表明,空间变换金字塔在融合原始图像的64x下采样特征和32x下采样特征时效果最好。


使用特权

评论回复
25
keer_zu|  楼主 | 2023-8-1 14:14 | 只看该作者
5. 结论

本文提出了一种简单而有效的三维车道检测方法BEV-LaneDet。为了保证不同车辆的前置摄像头空间关系的一致性,我们提出了一种虚拟摄像头,并通过实验证明了其有效性。此外,我们还通过实验证明了空间转换金字塔是一种鲁棒且芯片友好的空间转换模块,是有效的。实验表明,关键点表示是一个简单而有效的模块,它更适合表示车道结构的多样性。最后,我们相信我们的方法可以为额外的道路3D任务提供便利。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则