European Conference on Computer Vision(ECCV)是计算机视觉领域的重要国际会议,计算机视觉三大会之一。ECCV 2026将于2026年9月8日-9月12日在瑞典马尔默举办,共有10,473篇论文进入评审流程,最终2,883篇被接收,录取率为27.5%。ASC实验室本次接收3篇论文,主题涉及点云配准、协同三维感知、视觉定位等方向。

Unsupervised Point Cloud Registration via Training-Time Semantic Guidance

简介:点云无监督配准在自动驾驶与三维感知领域发挥重要作用,但户外场景固有的几何模糊性(如大量重复的几何结构)和数据稀疏性往往导致伪标签质量退化和模型收敛次优。本文发现,配准网络在无显式语义监督下,会自发产生与配准精度高度相关的内在语义感知能力。然而,这种内生能力在无监督学习的监督信号噪声下容易发生退化。为此,本文提出了一种无监督配准框架CAESAR,仅在训练阶段引入冻结的现成3D分割模型以提供稳定的语义锚点,在推理测试阶段实现了零额外计算开销,且不需要配准数据具备语义标注。具体而言,本文设计了双线索引导重匹配(DCRM)机制,从特征空间中重新挖掘被噪声掩盖的正确对应关系;提出了语义-几何标签挖掘(SGLM)进行高效的轻量级特征空间微调与高质量伪标签挖掘;并通过语义预测蒸馏(SPD)进一步巩固学生模型的语义认知。实验表明,CAESAR在KITTI和nuScenes基准测试中性能领先。

该论文第一作者是硕士生熊恪峥、硕士生徐诗韵,通讯作者是温程璐教授。并由敖晟助理教授、沈思淇长聘副教授、王程教授共同合作完成。


1781847599.png

C2E: Boosting Ego-Only 3D Object Detection via Multi-Teacher Contrastive Knowledge Distillation

简介:激光雷达三维目标检测是自动驾驶感知系统的核心任务。然而,传统的单智能体感知在复杂的户外场景中面临视角受限和遮挡严重等瓶颈,性能受限。多智能体协同感知近来展现出优异的性能,却受制于高昂的通信开销和累积位姿误差,难以实际部署。为此,本文探索了一种新的三维目标检测范式C2E,并提出多对单智能体对比知识蒸馏框架M2S。该框架首先设计多层级特征增强模块,为蒸馏提供更为稳定的特征表达;同时引入辅助点云重建和多教师对比蒸馏机制,有效弥合C2E范式在点云与特征分布上的域间差异。在V2XSet、V2V4Real及DAIR-V2X数据集上的实验表明,M2S框架在提升检测性能的同时规避了通信延迟和定位误差等协同固有缺陷。

该论文第一作者是本科生王锦龙、博士生黄勋,通讯作者是温程璐教授。并由博士生夏启明、博士生赵世佳共同合作完成。

1781847634.png

Rectified Embedding Flow Learning for Aerial Multi-view Geo-localization

简介:航空地理定位旨在匹配局部感知数据与地理参考数据库以实现目标位置推断,在无人机导航、自动驾驶与灾害救援等领域具有重要价值。然而,开放环境中感知数据的不确定性限制了单一检索系统的适用性,视觉特征在光照变化与弱地标场景下鲁棒性不足,文本查询不可避免地存在语义模糊与描述歧义。此外,现有通用多模态检索方法依赖文本指令区分检索意图,航空数据在特征空间中呈现高密度聚集的细粒度子分布,仅凭文本指令引入的宏观语义偏置难以重构跨视角所需的差异化分布结构。为此,本文提出统一的航空多视角地理定位(AMGL)任务,并设计了修正嵌入流学习(REFL)框架,将跨视角对齐建模为有向的条件分布传输过程。该框架由两阶段构成:首先,速度先验流学习(FL)拟合参数化速度场,构建各视角分布与潜在共享流形间的连续常微分方程(ODE)变换轨迹,学习多视角分布变换的先验知识;其次,轨迹引导的嵌入修正(ER)机制将查询特征沿学习到的轨迹连续传输至目标视图分布,显式建模并补偿不同视图间的细粒度分布偏移。此外,本文整合现有数据集构建了Aerial MVGL基准。实验表明,REFL在该基准上达到了领先的性能水平,平均R@1为44.83%,R@10为65.85%。

该论文第一作者是硕士生阮豪,通讯作者是罗志明副教授。并由博士生林金亮、博士生赖映鑫、李绍滋教授、臧彧副教授、王程教授共同合作完成。

1781847653.png