论文部分内容阅读
目标检测是图像处理中的经典问题。近十几年,人类活动检测的方法层出不穷。由于卷积神经网络可以将图像中目标特征通过卷积层较为精确的提取出来,得到图像目标的一个简洁的表达,卷积神经网络在图像检测与识别中的应用越来越受到广大人们关注。本文在Faster R-CNN目标网络的基础之上,结合图像的非局部相似等特征,提出了两种改进的算法。新算法增强网络对图像细微特征提取能力,并提高网络对图像中人的检测精确度。具体研究成果如下: (1)在Faster R-CNN ZF的基础上,对其共享卷积层进行特征融合,将前层提取的网络特征重新利用在后层卷积中。该改进使得原本特征随着网络层数加深而丢失的情况得到缓解,从而增强共享卷积层对图片中活动的人的细微特征提取,提高网络对活动中人的检测精度。实验结果显示,新算法与原始网络相比,不仅检测精确度得到了提升,而且对活动中人的定位更加精确。 (2)对网络候选框进行优化选取,改善网络候选框选取所使用的非极大值抑制算法(NMS),降低当重叠率大于阈值时舍弃候选框而导致目标漏检的情况,从而增强网络对目标的检测能力,提高检测精确度。实验结果显示,新算法不仅拥有更高的检测精确度,而且改善了原始网络对人的漏检情况。