基于注意力和Conv2Former的激光雷达三维目标检测算法
收藏资源简介
针对点云稀疏性导致现有三维目标检测模型在特征提取方面表现不足的问题,文中在PointPillars基础上提出一种融合注意力和Conv2Former的三维目标检测模型。在体柱特征编码网络中,设计了堆叠式多重注意力模块,融合点级、通道级和体柱级注意力有效增强点云局部特征表达能力,从而提升小目标检测精度;在特征融合网络中引入Conv2Former模块,通过卷积调制机制提高模型的全局上下文感知能力,进一步增强特征提取能力。在KITTI三维目标检测数据集上的实验结果表明:所提模型在车辆、行人和骑行者的3D检测精度较原始PointPillars模型分别提高了2.12%、3.56%和2.65%;此外,所提模型的执行速度达到38.46 f/s,完全满足实时处理的需求。上述结果验证了该模型在提升点云三维目标检测精度和实时性能方面的有效性与可行性。
资料为PDF文档格式.
本文档关键词:三维,测算,注意力,目标,激光雷达