论文部分内容阅读
物体检测是计算机视觉研究领域中一个极富挑战性的课题,是大量高级视觉任务的基础。尽管经历了数十年的研究发展,但在面对实际复杂变化场景时,物体检测的表现仍然存在不足。作为兼具分类和定位任务的复杂系统问题,物体检测始终在模型能力和计算代价的取舍中徘徊前进。针对一般物体检测,本文依据识别对象的几何变化,将目标分为结构化和非结构化目标。结构化物体检测的核心问题是如何表达目标的几何结构信息,如何建模结构化物体的几何变化。针对结构化物体检测,本文假设目标对象的几何变化是透视变换,使用点特征集合表达目标的几何结构,使用S-SVM分类器建模结构化物体检测算法。本文提出预训练和跟踪算法进一步提高结构化物体检测效率。实验结果表明预训练能提高分类器对同一类点特征的辨别力,跟踪算法在不严重损失准确度的情况下能大幅提高检测速度。非结构化物体检测的核心问题是如何表达目标区域信息,如何将候选区域的提取与物体分类统一建模优化。针对非结构化物体检测,本文使用基于特征学习的数据驱动特征来表达目标区域信息,使用Faster R-CNN建模非结构化物体检测算法。本文提出基于多层刺激的候选框融合算法进一步提高非结构化物体检测效率。实验结果表明多层刺激算法能进一步丰富特征抽象能力,该特征使得学习器学习出更加鲁棒的分类规则。综上所述,本文分析了结构化与非结构化的物体检测方法,并提出相应的改进算法,提高了在特定应用场景下的物体检测效率。