论文部分内容阅读
目标检测是计算机视觉领域的一项基本任务,在视频监控、自动驾驶、质量控制、图像检索以及目标跟踪等领域有着广泛的应用,具有重要的研究价值和应用价值。在目标检测中,候选框生成作为一种预处理手段,可以预先减少分类器所需分类的图像区域数量,提高目标检测的效率,且候选框生成算法的平均召回率与最终的目标检测结果成正相关,因此研究如何提高候选框生成算法的效率和平均召回率对提高目标检测效率和结果有很大的帮助。近些年来,卷积神经网络以其优良的高层语义特征提取能力和良好的可并行性,在计算机视觉领域得到了广泛的应用和发展,在许多基准图像数据集上获得了最佳的表现,成为当前目标检测等图像识别任务中的一个研究热点。在印刷电路板(Printed Circuit Board,PCB)的无损检测中,使用基于计算机断层成像(Computed Tomography,CT)得到的PCB图像进行过孔和焊盘的自动检测是提高检测效率的一种有效手段。有时候PCB图像会存在背景和目标的对比度低与噪声比较大的情况,传统的检测算法由于易受图像质量影响而不能很好的满足实际应用需求,而卷积神经网络拥有高层语义特征提取能力和很强的区分能力,能够有效检测过孔和焊盘。本文针对基于卷积神经网络的目标检测技术进行研究,主要成果包括:1、针对二值化范数梯度(Binarized Normed Gradient,BING)算法由于在固定尺度下以固定大小的滑动窗进行打分的方式生成候选框,无法捕捉任意尺度大小的目标,从而导致平均召回率低的问题,提出使用基于图的超像素分割(Graph-based Segmentation,GS)算法代替滑动窗的方式来生成候选框。在PASCAL VOC 2007数据集上的实验结果表明,本文算法能够有效捕捉目标的实际边界,提高生成的候选框的平均召回率。2、介绍了卷积神经网络及其关键技术的发展,涉及到数据处理、网络初始化、激活函数、池化方式、网络结构和优化时的正则化方法等关键技术的主要发展过程。借鉴参数线性修正单元的做法,将池化核作为参数进行学习,提出了参数池化,在MNIST、CIFAR-10和CIFAR-100等基准图像数据集上的实验结果表明,参数池化能够增强卷积神经网络对数据的学习和表达能力,提高网络的分类性能。3、针对PCB CT图像中的过孔和焊盘检测任务,制作了PCB CT图像数据集,设计了采用GS算法对BING生成的候选框进行求精的两级候选框生成算法和基于参数池化的卷积神经网络分类模型。实验结果表明,相比于BING算法,本文的两级候选框生成算法能够更好的捕捉过孔和焊盘的实际边界,在PCB CT图像数据集上的平均召回率达到了68%以上;相比于经典的霍夫变换算法,本文的检测模型能够同时检测过孔和焊盘,能够克服PCB CT图像对比度低、噪声大以及伪影影响等问题,获得更好的过孔检测结果,且对焊盘的检测结果也能够满足实际应用需求。