论文部分内容阅读
目标检测是一种运用计算机视觉及机器学习相关算法,在图片或者视频序列中,检测出感兴趣目标并给出其位置及类别信息的技术方法。目标检测具有很高的理论研究价值,一直以来都是国内外各大高校及研究机构的研究热点。此外在自动驾驶、增强现实、视频监控安防等实际场景中也有着广泛的应用需求。当前主流的目标检测算法主要分为传统目标检测算法和基于深度学习的目标检测算法两大类。传统目标检测算法使用滑动窗口等方法在给定的图像中生成一系列候选区域,再对每一候选区域提取统计特征,进行分类识别。这类方法提取的特征难以表征多类别之间的差异,在通用目标检测任务中准确性较差。基于深度学习的目标检测算法使用统计或神经网络提取候选区域,再使用经过训练的深层的卷积神经网络提取特征进行分类识别,准确度显著优于传统方法。本文基于对当前主流目标检测算法的分析,提出了基于深度学习的细节特征重组算法,取得了较好的结果并实现了面向实际场景的目标检测系统。主要工作内容如下:(1)基于深度学习目标检测算法中的一步检测算法和两步检测算法分别实现了通用目标检测,并对其中的基底网络和多尺度输出等模块进行了分析调整,获得了较好的实验结果。其中基于深度学习的两步检测算法用卷积神经网络对预先提取的候选区域提取分类特征,进行分类识别,准确度较高,资源消耗也相对较大。而基于深度学习的一步检测算法利用卷积神经网络的输出同时给出目标的候选区域和所属类别,虽然由于所使用的多尺度输出层尺度较小,对原图中较小尺度目标的检测准确度差于两步检测方法,但其所占用的运算资源要少很多,速度也相对较快。(2)基于对基于深度学习的一步检测算法的分析,本文提出了基于细节特征重组方法的目标检测算法。细节特征重组方法在基于深度学习的一步检测算法当中的多尺度输出层上引入了级联的反卷积层,对原来尺度较小的特征图进行上采样,将其中的一些细节信息如小尺度目标、大尺度目标的边缘等重新恢复出来,帮助进行分类和定位,显著提升了整体的检测准确度。(3)基于细节特征重组方法,本文使用基于服务器和基于移动设备两套方案实现了目标检测系统,经过数据准备和模型训练,完成了对景点检测和商标检测两个应用场景的检测任务,在测试集和实地均取得了较好的成果。