专栏名称: 泡泡机器人SLAM
SLAM的最新资讯,干货内容。
目录
相关文章推荐
51好读  ›  专栏  ›  泡泡机器人SLAM

【泡泡点云时空】DETR3D:一种基于DETR的3维物体检测算法

泡泡机器人SLAM  · 公众号  · 机器人  · 2023-06-09 06:30

正文

请到「今天看啥」查看全文


1、直接在3D空间中预测3D包围盒,而无需估计物体的深度或者做三维重建。

2、利用多相机将预测的3D包围盒特征投影到所有可以投影的图像帧上来做估计;

3、将DETR拓展到3D­应用场景;

算法流程

图1 算法架构图

Encoder:

从图1中可以看到算法的输入是车身四周相机采集到的照片以及相机的内外参。使用ResNet作为Encoder对图像做特征编码,然后又接了一个FPN来获得多尺度特征。

Decoder:

2D特征与3D预测框的转换就是在这里实现的。图1中Object Queries即为初始化的3D框,经过self-attention的到预测的3D reference point信息,即Cli,论文中说明,预测的3D信息主要包括  :BEV坐标系下的包围盒的中心位置,大小,朝向角以及速度。这个过程由图1中的 蓝色路径 表示。

由于预测的3D reference point信息是在BEV坐标系下的,因此需要借助相机的内外参数将其转换到图像坐标系下得到Clmi,也就是3D转到2D,是图1中绿色路径;

现在需要将图像空间中的Clmi对应到FPN后多尺度图层上,而映射到多尺度特征图时极有可能找不到对应的特征点,因此作者采用了双线型插值,来使3D reference point对应到不同的特征图层上,这个过程就是图1中的 黄色路径

将映射后得到的图像特征再与Object query做cross-attention,来优化Object query的结果。这个过程就是图1的 红色路径







请到「今天看啥」查看全文