论文部分内容阅读
目标检测是计算机视觉领域中一个非常重要的问题,其主要任务是判断感兴趣目标是否在图像中出现,并估计目标的位置和尺度。目标检测问题涉及到图像处理、机器学习、最优化理论、线性代数、图论等多个学科,具有极其重要的理论研究价值。另外作为许多计算机视觉智能系统的重要组成部分,目标检测同样具有很高的实际应用价值。经过近二十多年的研究,目标检测方向获得了大量有价值的成果,其中基于窗搜索框架的检测方法因其简单的系统架构和较高的检测精度受到业内的极大关注,是现今研究最多应用最广的一类方法。尽管如此,窗搜索检测方法仍然存在检测速度慢、训练复杂度高、目标重复检测以及定位精度低等诸多问题亟待改进。本文主要针对现有窗搜索检测方法的不足之处开展深入研究,并提出了相应的解决方案。本文开篇阐明了目标检测的主要任务、研究背景和研究意义。其次介绍了窗搜索检测方法的基本框架及关键技术,并对各关键技术的研究现状及存在问题进行了分析和梳理。在总结分析已有研究成果的基础上,本文紧紧围绕窗搜索检测方法尚待解决的问题开展研究工作,主要包括如下五个方面:1.研究给出一种基于区域生长的窗搜索方法。窗搜索方法一般为了防止漏检目标,会产生大量候选窗口,从而加大了目标检测的计算负担,限制了目标检测速度。为了解决该问题,本文提出了一种基于区域生长的窗搜索方法。该方法基于图像的分割线索和目标的先验知识产生候选窗口,在不丢失目标的情况下,仅产生少量的候选窗口,加之其本身具有较高的计算效率,因此能有效提高目标检测速度。2.研究给出一种级联选择窗目标检测方法。单独采用选择性窗搜索方法提速效果有限,为了进一步提升检测速度,本文提出了一种级联选择窗快速目标检测方法。该方法分别从三个方面提高检测速度:1)利用稀疏随机矩阵把高维图像特征进行压缩,减少了特征提取时间;2)研究得到一种软级联支撑矢量机,能够对候选目标窗口进行快速准确判断;3)将选择性窗搜索策略引入到级联分类器中,能够由粗到精的采集窗口,进一步减少了计算消耗。实验结果表明提出方法能够有效地提高检测速度,且检测精度能与现有最先进的方法相媲美;此外大大缩短了级联分类器训练的时间。3.研究给出一种基于局部区域稀疏表达的目标检测方法。针对已有研究存在训练过程复杂的问题,提出了一种基于局部区域稀疏表达的目标检测方法。该方法首先提取目标局部区域作为训练样本;其次学习得到一个具有较强判别性的字典,字典中的每个基与目标各局部区域有明确的对应关系;接着基于各候选窗口稀疏编码的响应检测目标局部区域;最后利用目标局部区域的检测结果和位置约束进行投票,完成目标定位。实验结果显示该方法的训练过程仅需要少量正样本,且训练耗时少,较好地解决了模型训练复杂的问题。同时由于它借鉴了基于部分检测目标整体的思想,从而能够有效克服遮挡、目标形变、视角变化对检测的干扰,增强了检测鲁棒性。4.研究给出一种基于热扩散框架的窗融合方法。针对窗搜索方法存在目标重复检测的问题,提出了一种基于热扩散框架的窗融合方法。该方法首先把每个初始窗口当作热力学系统中的一个位置,其次根据两个窗口的检测分数和重叠面积来计算对应位置之间的热传导系数,最后利用线性各向异性热扩散条件下系统温度之和最大化问题来模拟窗融合工作。实验结果表明提出的方法不仅能够删除重复检测,还可以排除部分误检以及防止相邻目标干扰。5.研究给出一种基于多线索的目标检测方法。窗搜索检测方法利用矩形窗口表征目标检测结果,无法把目标从背景中精确分割出来。针对上述问题,提出了一种基于多线索的目标检测方法。该方法利用窗口检测结果、超像素的成对关系、分割区域的目标概率和一致性概率构建基于条件随机场模型的目标函数,通过权衡多个线索分割出最终的目标。实验结果表明该方法在复杂背景、多目标、尺度变化情况下,仍然能够获得理想的目标分割结果。本文最后对上述所有方法的优缺点进行了总结,并指明了下一步的研究工作。