ASC实验室@CVPR 2025共接收9篇一作论文,其中8篇为激光雷达点云处理方向(视觉定位/对抗学习/目标检测/人体动捕/点云配准)。代码数据陆续开源中。
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)是计算机视觉领域的顶级国际会议,CCF A类会议。CVPR2025将于2025年6月11日至15日在美国田纳西州纳什维尔举办。CVPR 2025 共有13,008 份投稿,录用2878篇,录取率为 22.1%。
LightLoc: Learning Outdoor LiDAR Localization at Light Speed
简介:现有基于隐式表征的定位方法通常需针对每个新场景进行长达数天的模型训练,难以满足自动驾驶等时间敏感应用需求。为此,本文提出LightLoc方法,旨在高效快速完成新场景定位。LightLoc采用冻结场景无关编码器、仅训练场景特定回归器的策略,并创新性地引入样本分类指导和冗余样本下采样技术,从而显著降低训练时间与数据冗余。实验表明,LightLoc仅需1小时即可达到最优性能,训练速度较现有方法提升50倍。
该论文第一作者是厦门大学信息学院2021级博士生李文,通讯作者是王程教授、于尚书博士(南洋理工大学)。由刘晨、刘敦强、周寅(GAC R&D Center)、沈思淇长聘副教授、温程璐教授共同完成。
02
DiffLO:Semantic-Aware LiDAR Odometry with Diffusion-Based Refinement
简介:LiDAR里程计方法在场景理解不足和噪声干扰的情况下容易出现不准确的位姿估计。针对这一挑战,本文提出了一种基于扩散优化的语义感知LiDAR里程计网络(DiffLO)。为应对动态、低纹理等复杂场景的影响,本文通过语义蒸馏方法,将语义信息融入里程计任务中,使网络更关注对位姿估计有益的物体。此外,本文提出了基于扩散的优化方法,利用与位姿相关的特征作为条件约束,通过生成多样性迭代优化位姿估计。在KITTI里程计数据集上的实验表明,该方法超过了近期所有基于学习的方法。
该论文第一作者是厦门大学信息学院2023级硕士生黄泳树,通讯作者是王程教授。由刘晨、朱明航、敖晟助理教授、温程璐教授共同合作完成。
03
Boosting Adversarial Transferability through Augmentation in Hypothesis Space
简介:对抗样本的可转移性特性指针对一个模型生成的对抗样本可能对其他模型同样有效。现有研究通过设计复杂的数据和模型交互机制来提升可转移性,但效果有限且与数据模态强相关。本文发现模型的泛化性和对抗样本的可转移性之间存在镜像关系,可通过增强假设空间来提高可转移性的可能性。为此,本文设计了一种基于扰动的随机优化攻击OPS,利用输入变换算子和随机扰动生成更具可转移性的对抗样本。实验表明,OPS在图像和点云上均显著优于现有最优方法,在性能和效率方面表现优异。
该论文第一作者是厦门大学计算机科学与技术系2023级硕士生郭宇,通讯作者是王程教授。由刘伟权(集美大学)、徐青山(南洋理工大学)、郑士均、黄舒俊、臧彧副教授、沈思淇长聘副教授、温程璐教授共同合作完成。
04
SP3D: Boosting Sparsely-Supervised 3D Object Detection via Accurate Cross-Modal Semantic Prompts
简介:稀疏监督目标检测方法在标注量极度缺乏时很难保持性能。本文提出SP3D方法,利用跨模态的语义提示显式增强稀疏监督3D目标检测性能。本文首先引入可信点语义迁移模块,利用多模态大模型和图像数据生成高可信度的跨模态语义提示。其次,将语义提示作为种子点,通过动态伪标签生成策略和分布形状得分生成高质量伪标签。最后,使用少量的标注数据对检测器进行微调。在KITTI和Waymo数据集上的实验结果表明,SP3D显著提升了SoTA稀疏监督目标检测器的性能,在零样本设置中也表现优异。
该论文第一作者是厦门大学信息学院2023级博士生赵世佳、2022级博士生夏启明,通讯作者是温程璐教授。由郭徐晟、邹普凡、郑茂基、吴海、王程教授共同合作完成。
05
V2X-R: Cooperative LiDAR-4D Radar Fusion for 3D Object Detection with Denoising Diffusion
简介:当前多智能体协同感知系统在恶劣天气条件下性能显著下滑。4D 毫米波雷达可提供多普勒和额外的几何信息,本文提出了一种新颖的LiDAR-4D Radar融合目标检测框架,并提出4D Radar特征辅助的LiDAR去噪扩散模块(MDD)。此外,本文构建了V2X-R,首个包含激光雷达、相机和 4D 毫米波雷达的V2X仿真数据集。实验表明,本文的方法在 V2X-R 数据集上表现优异,且MDD 模块可有效提升模型在恶劣天候下的性能。数据集和代码已开源:https://github.com/ylwhxht/V2X-R
该论文第一作者是厦门大学AI研究院2024级博士生黄勋,通讯作者是温程璐教授。由王锦龙、陈思衡副教授(上海交通大学)、杨必胜教授(武汉大学)、Xin Li教授(Texas A & M University)、王程教授共同合作完成。
06
Learning to Detect Objects from Multi-Agent LiDAR Scans without Manual Labels
简介:无监督3D目标检测在离线标注中面临数据稀疏性和视角限制的问题,导致基于聚类拟合生成的伪标签质量低。为此,本文提出了一种新颖的无监督方法DotA,从多智能体间的点云扫描中学习检测目标,无需外部标注。DOtA通过协作智能体共享的姿态和形状信息初始化检测器并推断初步标签,再结合智能体间的互补观测进行多尺度编码区分高低质量标签,用于指导特征学习。实验表明,DOtA在V2V4Real和OPV2V数据集上优于现有最优方法,并验证了其在协作感知框架下的有效性。
该论文第一作者是厦门大学信息学院2022级博士生夏启明,通讯作者是温程璐教授。由林文铠、项浩恩、黄勋、陈思衡副教授(上海交通大学)、董震教授(武汉大学)、王程教授共同合作完成。
07
ClimbingCap: Multi-Modal Dataset and Method for Rock Climbing in World Coordinate
简介:攀岩是一类新兴的运动,风靡全球备受青睐。我国在2024年奥运会上获得了两枚攀岩银牌,通过攀岩动捕算法对攀岩动作进行精细分析能够有助于提高运动员训练效果,提高比赛成绩。但是现有国际上动作捕捉算法对攀岩动作的准确度较低,有两个原因,一是现有的攀岩数据集数量有限,二是现有攀岩算法没有充分考虑全局坐标系4D人体攀爬运动恢复。本文收集了一个大规模、质量高且具有挑战性的攀爬运动数据集AscendMotion,提出了采用RGB相机和激光雷达在全局坐标系中对4D人体攀爬运动进行运动恢复的动捕算法ClimbingCap。实验验证了该数据集的质量以及本文提出的攀岩动捕算法的有效性。
该论文的第一作者是厦门大学信息学院2023级博士生颜明、2024级硕士生林心成,通讯作者是沈思淇长聘副教授,由钟齐鑫(国家攀岩队)、钟林财(浙江省攀岩队)、马月昕助理教授(上海科技大学)、许岚助理教授(上海科技大学),罗裕华、范书琪、戴雨笛、温程璐教授、王程教授共同合作完成。

08
Progressive Correspondence Regenerator for Robust 3D Registration
简介:现有的对应关系优化方法无法在极端离群点比例下正确识别准确的对应关系。为此,本文提出了一种名为Regor的渐进式点云配准方法。通过渐进式的局部匹配与全局优化,该方法能够在大量离群点的情况下,生成高质量的匹配结果。大量室内和室外数据集的实验结果表明,所提方法显著优于现有的离群点去除技术。最为关键的是,Regor比现有离群点去除方法获得了10倍以上的正确对应关系。
该论文第一作者是厦门大学信息学院敖晟助理教授、赵桂瑜(北京理工大学),通讯作者是郭裕兰教授(中山大学)。由张晔副研究员(中山大学)、徐凯教授(国防科技大学)共同完成。
09
Federated Learning with Domain Shift Eraser
简介:联邦学习(FL)中用户的数据域转移现象常常阻碍用户模型学习一致的表示空间。为此,本文提出了一种个性化联邦FL框架——联邦域偏差消除器(FDSE),通过差异化消除每个客户的领域偏差并增强其共识来提升模型性能。具体而言,FDSE将模型前向传播过程建模为一个迭代的去偏过程,交替进行共识增强的特征提取和个性化域偏差消除。实验表明了FDSE方法在准确性、效率和泛化性方面的优势。
该论文第一作者是厦门大学信息学院2022级博士生王铮,通讯作者是王程教授。由王子徽博士(鹏城实验室),王郑,范晓亮高级工程师共同合作完成。