近日,我院以杭州电子科技大学为第一单位发表的论文《IAE-BEV: Instance-Aware Enhancement for Bird’s-Eye-View Representation in Multi-View 3D Object Detection》被自动驾驶领域顶级期刊 IEEE Robotics and Automation Letters (二区期刊) 录用。该论文的第一作者为我院2023级硕士研究生王彬,指导老师为我校赵强研究员和颜成钢教授。 基于相机的鸟瞰图(Bird’s-Eye-View, BEV)表示,已成为推动低成本自动驾驶三维目标检测的重要途径。其中,Lift-Splat-Shoot(LSS)框架凭借高效与易部署的优势,逐渐成为主流方案。然而,该框架在空间展平过程中不可避免地引入冗余背景噪声,同时受制于相机成像特性,其生成的 BEV 特征呈现出稀疏与不完整性,导致检测精度和鲁棒性受限。为解决这些瓶颈,该研究提出全新的两阶段多视角三维检测框架 IAE-BEV。该方法通过自适应引入实例级特征,在增强 BEV 表示的实例敏感性的同时,有效缓解了稀疏性问题;同时设计的 Occupancy Mask Pool (OMP) 实现了特征与目标区域在二维图像域的高效耦合,使实例与像素级表征间建立更精准的交互;进一步提出的 Angle-Adaptive Self-Attention (AASA) 模块,可在共射线方向上自适应调整特征权重,实现对跨实例特征的细粒度区分与全局一致性建模。大量实验表明,IAE-BEV 在 nuScenes 数据集上展现出卓越的泛化性与鲁棒性,相较最新 LSS 基线在 mAP 上实现 +2.96% 的提升;在复杂真实场景中,也能更清晰刻画动态目标边界与潜在目标,充分验证了所提框架的有效性与优越性。 杭州电子科技大学“智能信息处理”实验室 (HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生200余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名企业。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学