论文部分内容阅读
随着基于深度学习的图像处理技术不断发展和硬件计算能力的提高,目标检测技术在近年取得了极大的发展。目标检测技术能够定位和识别图像中的目标,在图像检索、场景理解和事件检索等任务中发挥了十分重要的作用。然而实际应用场景中,目标检测算法的检测性能仍然有提升空间,优化和改进目标检测算法的检测性能正成为学术界的和工业界的研究与应用热点领域,具有重要的理论价值和现实意义。目标检测应用场景中,目标的尺寸变化和目标间的互相遮挡问题是影响算法检测性能的主要因素。尺寸变化主要是由于目标与取景器的距离不同,导致不同目标在画面中的占比各不相同;而遮挡问题主要是由于目标在移动过程中出现重叠,造成目标的部分特征丢失而难以检测。针对上述问题,本文基于一阶目标检测器SSD(Single Shotmultibox Detector)改进和优化了模型结构与损失函数,提升了 SSD目标检测模型针对多尺度目标和遮挡目标的检测能力。本文的主要研究内容和研究成果如下:(1)概述了目标检测技术及其流程,着重分析了传统目标检测技术到基于深度学习的目标检测技术的发展历程和关键技术,并着重讨论了目前典型的目标检测框架,最后对这些常用检测框架如R-CNN,Fast R-CNN、Faster R-CNN和YOLO(You Only Look Once)等的特点进行了分析和评估。(2)重点介绍了 SSD检测算法的模型结构,候选框生成和匹配策略,数据集处理策略和损失函数。通过对SSD的多尺度输出结构,发现SSD模型对小目标检测能力不足,论文提出了小目标特征提升模块和6尺度特征融合输出结构,并在Pascal VOC数据集和MS COCO数据集上进行仿真实验。实验结果表明改进的SSD目标检测模型对于小目标的检测具有更高的精度,并且对于不同的目标类型和场景具有更强的鲁棒性。(3)提出了基于Repulsion损失函数改进的遮挡目标损失函数和C-NMS(Central distance based Non-Maximum Suppression)算法。通过分析 Repulsion损失函数针对目标部分重叠的场景下存在的检测性能不足问题,改进了Repulsion损失函数的吸引项和排斥项。分析传统NMS(Non-Maximum Suppression)算法在处理遮挡目标时的缺陷,提出了基于中心距离的C-NMS。实验也验证了基于改进损失函数和C-NMS算法的SSD算法针对目标重叠的场景拥有更好的检测效果。