论文部分内容阅读
随着视频/图像采集技术的发展、硬件计算能力的提高,对视觉内容的分析受到越来越多的关注。物体检测作为许多视觉问题的初始化步骤,是计算机视觉系统的重要组成部分。行人检测是物体的典型代表,有着重要的研究意义和实际的应用价值。因此,以行人为对象的物体检测逐渐成为计算机视觉研究领域的一个热点。
本文旨在探索行人检测的原则和方法。针对目前非铰接体的检测方法无法直接应用于行人的问题,重点讨论了在样本预处理、检测器设计和检测器应用方面的问题,它们分别是:样本的自动对齐问题、姿态的多变性问题,以及视角和场景的适应问题。具体的研究内容如下:
提出了同时自动对齐和学习检测器的思路,以处理样本的对齐问题。基于二元分类的检测器,首要考虑的问题就是训练样本的对齐和归一化。针对人工对齐困难和最优对齐准则难以确定的问题,将样本的自动对齐问题转化为样本的选择问题,并提出了基于自助提升(boosting)多示例学习的样本自动对齐方法。该方法的优点在于减少人工劳动量和提高分类器性能。另外,将判别式图嵌入降维与决策树结合,提出了一种应用于自助提升方法的弱分类器,来有效的利用基于直方图的特征。
提出了将基于全局和基于部件方法相结合的建模思路,以处理行人姿态的多变性问题。通过分析这两种建模方法的优缺点,提出了层次的部件模型。该模型有别于传统基于部件的模型,利用全局模板来初始化部件模板,而基于多示例学习的部件模板能有效的处理姿态变化。在特征的组织方面,提出了共享特征和异构特征来平衡性能和速度。与现有基于全局和基于部件的模型相比较,提出的模型能有效减少姿态变化带来的问题。
提出了基于迁移学习的思路,来解决检测器的适应问题。针对于行人检测器的视角和应用场景多变的现象,从减少样本的人工标注和提高检测器的性能出发,提出了特征层次和分类器层次的迁移学习算法。基于相似视觉任务之间特征的可共享性,提出了特征漂移的算法来实现特征层次的迁移。在分类器层次上,基于协同变量漂移的思想,提出了协同变量自助提升方法来利用相关的样本提高检测器的泛化能力。最后,将该算法应用于视角和场景的适应问题,有效的提高了检测器在特定环境下的性能。