论文部分内容阅读
目标检测是很多计算机视觉应用的基础,比如实例分割、人体关键点提取、人脸识别等,它结合了目标分类和定位两个任务。目前,目标检测的研究热点主要集中在基于深度学习的方法上,而基于深度学习的目标检测算法在小目标检测问题上还存在较大研究空间。因此,论文从正负样本不平衡问题、多尺度检测问题以及训练数据集三个方面研究了目标检测中的小目标不敏感问题,经过实验证明,论文设计的结构可以有效处理小目标不敏感问题。以下是论文取得的主要研究成果:(1)对目标检测算法中的正负样本不平衡问题进行了研究和实验。目标检测中的正负样本不均衡问题是由训练数据集带来的,训练数据集中的任意一幅图像中所包含的目标数一般很少,即正样本数量少,而包含背景的负样本往往很多,这样带来的问题是算法检测负样本的能力强于正样本,Focal Loss算法通过改进分类损失函数解决了这一问题,但是Focal Loss带来了额外的超参数部分,虽然解决了正负样本不均衡但是却带来了调节超参数的问题。论文参照Focal Loss的思想从分类损失函数入手,提出了与Focal Loss效果相似但不包含任何超参数的分类损失函数SCE,论文最终的实验证明,SCE达到了接近Focal Loss的效果,其相对于Focal Loss的精度误差基本都保持在1%以内,虽然未能超越Focal Loss的表现,但是却省去了调节超参数的问题。(2)对目标检测算法中的多尺度检测问题进行了研究和实验。目标检测中的多尺度检测问题主要表现为对小目标的检测效果较差,FPN是处理多尺度检测问题的有力手段,本文基于FPN设计了全新的Dense FPN结构,Dense FPN去除了FPN中的上采样过程,在每一个特征提取层之后添加了数量逐层递减的连续卷积层。通过论文的实验显示,Dense FPN在处理多尺度检测问题上具有良好的表现,其在APS、APM和APL三个评价指标上的值均超越了原始FPN 1%左右,显示了Dense FPN在处理多尺度检测问题上的优异性能。(3)从训练数据集的角度研究了小目标不敏感问题。虽然正负样本不平衡和多尺度特征融合是影响目标检测中小目标检测性能的一部分原因,但这些因素都是间接地产生影响,而训练数据集中小目标数量少、缺乏语义信息是直接造成目标检测中小目标检测性能差的原因。本文基于原始的MS COCO数据集设计了特定的小目标数据集,数据集中的图像样本只包含小目标,不包含其他尺寸的目标,论文中的实验证明小目标数据集只会对目标检测评价指标中的APS产生显著的性能提升,而会损失其他几类评价指标的值,论文最后将小目标数据集和原始的MS COCO数据集混合,然后使用混合的数据集训练各类目标检测框架,实验证明使用混合数据集可以同时提升AP、AP50和AP75以及APS、APM和APL的值。论文最后对设计的损失函数、多尺度特征提取结构以及小目标数据集进行消融实验研究,在AP、AP50和AP75以及APS、APM和APL这六个评价指标中均取得了最佳的结果,证明了SCE损失函数、Dense FPN和小目标数据集的有效性。设计出了更加鲁棒和高效的小目标检测架构,提升了常用目标检测的小目标敏感性。