学术动态 | 通信工程学院研究生一作论文被IEEE Transactions on Multimedia 录用

近日,通信工程学院智能信息计算团队的研究成果《Enhance Panoramic Object Detection Using Planar Image Datasets》被多媒体领域顶级期刊IEEE Transactions on Multimedia(一区top期刊)录用。第一作者为24级博士研究生于龙龙,指导老师是赵强研究员,颜成钢教授和代锋研究员(中国科学院计算所)。

这篇论文研究了全景目标检测任务中的数据瓶颈问题。全景图像因能提供全面空间信息而应用广泛,但获取成本高和标注复杂导致数据集规模与质量受限,制约模型性能提升。现有利用平面图像合成全景图像的方法存在几何失真,导致合成前后目标形状不一致,且因平面图像视场角远小于全景图像,合成全景图像存在空间信息缺失问题,同时传统基于目标中心点估计的标注方法存在不可避免的计算误差。

图片

为解决这些问题,论文提出一系列创新方法:引入低失真的平面图像转全景图像方法;开发基于最小球面凸多边形区域确定的球面包围框计算新算法,无需依赖目标中心点估计;提出有效填充合成全景图像空白区域的新方法以弥补空间信息缺失;针对全景图像失真特性设计创新数据增强策略。在实验中,基于COCO生成两个合成全景数据集用于模型训练,结果表明使用这些合成数据集训练显著提高了预测精度,远超现有先进方法,有助于释放全景目标检测模型的全部潜力。

图片


智能信息处理实验室



杭州电子科技大学 “智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师50余名,含5位国家级人才及多位省级人才。现有硕博生200余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名企业。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。


联系我们

联系人:孙老师

电话:0571-86878691

工作电话:0571-86878691

电子邮箱:syq@hdu.edu.cn

智能信息处理实验室

浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学