近日,课题组夏启明博士生、邓锦豪硕士生、温程璐教授(通讯作者)、吴海博士生、马普所博士后史少帅、德州农工大学李昕教授、王程教授共同完成的论文“CoIn:Contrastive Instance Feature Mining for 3D Object Detection with Very Limited Annotations”被国际计算机视觉大会(ICCV,International Conference on Computer Vision)接收。ICCV由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会。ICCV在世界范围内每两年召开一次,是三大会议中公认级别最高的会议,也是中国计算机学会推荐的A类会议。
三维目标检测主要研究如何在三维空间中找到被检测目标的三维位置,并预测大小、类别和方向。三维目标检测方法在计算机视觉、无人驾驶和机器人领域有着广泛的应用。在无人驾驶领域,三维目标检测可以帮助车辆感知周围环境,识别并预测其他车辆、行人和障碍物的位置和行为,从而实现自动驾驶的安全性和效率。在机器人领域,三维目标检测方法可以使机器人具备感知和理解周围环境的能力,从而实现自主导航、物体抓取和环境交互等任务。
针对目前三维目标检测器的性能依赖于准确三维包围框标注的问题,本论文提出了一个基于稀疏标注的端到端三维目标检测方法,称为CoIn。该方法设计了多类别对比学习模块(MCcont)以增强前景特征之间的特征鉴别力,设计了伪标签挖掘模块(InF-Mining)以从未知特征中挖掘潜在伪前景特征,还设计了真伪对比学习模块(LPCont)以保证伪前景特征的正确性。多个数据集上的实验结果验证了CoIn的有效性,在三维目标检测常用的KITTI数据集上,只使用2%的标注量就能达到接近全监督检测器的水平;在Waymo和nuScenes大型户外无人驾驶数据集上也大大提升了基线方法的精度。