论文部分内容阅读
近年来深度学习在目标检测方面取得了很大的进步,然而其成功很大程度上是源于大规模的标定数据集。在真实的应用场景中,标定大量数据往往代价太大而不可行。为了解决数据标定的难题,学界提出了弱监督/半监督目标检测方法。然而由于缺乏充足的监督信息,这些方法大都性能较差。 另一方面,我们在研究目标检测的过程中发现,物体的检测问题是一个非常适合迁移学习的任务,因为不同物体在轮廓的显著性上有着很高相似度。比如人类在识别一个新目标时,借助相关的背景知识,只需要很少的训练样本就能学会这个新物体。 因此,为了解决目标检测中的标定难题,本文提出了一个卷积检测网络知识迁移框架(Transfer Detection Framework)来模仿人类的视觉学习模式。 本文主要的研究内容和贡献点可以分为三部分: (一)针对迁移目标检测任务,本文提出了一个全新的卷积网络。通过将Faster RCNN的two-stage检测模式和SSD的特征金字塔结构相结合,我们设计的网络结构在迁移检测任务中优势突出。 (二)针对小样本情形下网络的训练难题,本文提出了知识迁移(Transfer Knowledge,TK)和背景抑制(Background Depression,BD)两个损失函数。其中,TK通过源数据集上的目标检测知识来引导网络的训练,BD通过限制神经网络在背景区域的输出值而专注于目标区域。 (三)针对弱监督情形下网络的训练难题,本文提出了半监督迁移检测算法(Semi-Supervised Transfer Detection,SSTD)。针对弱标定图片,本文设计了一个完全端到端训练的卷积检测网络,其中分类器生成伪标签(Recurrent Object Labelling,ROL)和知识迁移(TK)模块为图片提供监督信息。通过这个一体化的卷积检测网络,我们的SSTD算法在弱标定图片上能够以全监督的形式进行稳定的端到端训练。 最后我们在数据集ImageNet,Pascal VOC上进行了大量的实验,结果表明,与目前最好的方法相比,本文提出的卷积检测网络知识迁移框架在检测精度上有着很大的优势。