论文部分内容阅读
目标检测的主要目标是从静态图像或视频序列中识别并定位感兴趣的目标物体,它是计算机视觉领域的关键任务之一。目标检测的实现综合运用了图像处理、机器学习、深度学习和人工智能等技术,在军事演练、医学图像分析、智能交通、工业检测和人机交互等领域都有着广泛的应用。然而,目标通常在亮度、形态、颜色、遮挡等方面存在多变因素,且受到缤纷复杂的环境因素干扰,使得目标检测算法的研究机遇与挑战并存。本文研究了基于卷积神经网络的目标检测算法中的两类主流框架,分别基于目标候选框和回归思想。对于基于目标候选框的目标检测,本文提出了一种基于级联卷积神经网络的目标检测算法,旨在解决目标候选框定位偏差大以及背景样本干扰问题,创新点在于提出的一种优化网络可以用于优化区域候选网络生成的目标候选框,提高候选框的定位精度,并为每一个目标类别设计了一个二值分类器,使得所提取的特征能够表示更多的类内差异,进而排除检测中的背景样本。对于基于回归思想的目标检测,本文提出了一种基于全卷积网络的实时目标检测算法,旨在解决回归方法中小目标检测精度低以及位置精确性差等问题,创新点在于提出的全卷积网络由于不受输入尺度的影响增加了模型的检测灵活性,同时提出一种多特征融合和多边框预测策略,有效提高了小目标的检测精度。为了证明所提算法的有效性,本文利用PASCAL VOC数据集进行了目标检测实验。本文分别以每个目标类别为单位,计算了各个类别检测结果的准确率以及所有类别平均的准确率,实验证明本文提出的基于级联卷积神经网络的目标检测算法性能优于R-CNN系列的检测方法,高于Faster R-CNN模型3.1%,基于全卷积网络的多特征融合的目标检测算法性能优于YOLO等基于回归思想的检测算法,高于YOLO模型10%以上。