论文部分内容阅读
物体检测是计算机视觉的一个核心研究问题,在机器人的视觉环境感知、人脸识别、行人检测、智能视频分析、图像检索等领域有着广泛的应用。由于图像采集过程存在光照条件变化、视角变化、尺度变化、物体自身的非刚性变形、局部遮挡以及背景复杂等因素,使得物体的外观特征产生较大的变化,给物体检测算法带来了极大的挑战性。特征提取与表达是物体检测的关键步骤。尽管底层特征表达在视觉检测问题上已取得了较大成功,然而越来越多的研究人员指出,仅用底层特征的传统方法并不能对图像进行充分表达。针对底层特征通常只保留图像级别信息而不包含高层语义属性的问题,有研究者提出了结构化图像描述的中层特征表达方法,并迅速成为图像识别领域的研究热点。由于中层特征包含了高层的语义属性,具有更好的推广能力,因此,相比于底层特征的方法,在识别任务上能够取得更好的识别性能。虽然基于中层特征的识别方法取得了较大成功,但是如何更加有效地提取中层特征,获得高层语义属性表达仍然是一个具有挑战的问题。本文针对机器人视觉环境感知过程的物体检测问题,研究中层特征的提取与表达方法,以提高物体检测方法的性能,主要研究内容包括:(1)提出了一种基于视觉注意机制的ESVM物体检测方法。为了提高物体检测算法的效率,采用由粗到精的分级检测策略。首先,在粗检测阶段,受生物视觉系统启发,借鉴视觉注意的思想,在提取中层图像块的基础上,采用梯度范数进行中层特征表达,进而利用支撑向量机(SVM)对图像的前景和背景进行区分,得到物体的粗检测结果;然后,在粗检测的基础上,采用范例-支撑向量机(Exemplar SVM,ESVM)方法进行进一步的精检测,得到最终的结果。在多个数据集上的实验结果表明,所提出的方法能够在保证算法效率的同时,取得了优于其他流行方法的准确率。(2)提出了一种基于边缘结构相似度RCNN的物体检测方法。首先,利用融合边缘结构相似度的区域合并方法,改进选择性搜索中的合并策略,实现对图像候选区域的有效提取;然后,将提取到的图像候选区域作为卷积神经网络的输入,进行特征提取;最后,利用SVM分类器进行特征分类与检测。实验结果表明,本文方法大大提高了物体检测的准确率。(3)提出了基于一种多通道分层特征的物体检测方法。为了更好地表征检测物体的内容,首先,利用基于简单线性迭代聚类算法对图像进行分割,并根据熵值大小,选取一定数量的最具代表性和鉴别性的中层图像块;然后,将得到的中层图像块与基于选择性搜索策略得到的图像候选区域进行卷积计算,得到图像的卷积特征分层表达,并将其与卷积神经网络通道提取的特征进行融合,得到最终的物体特征表达;最后,利用SVM进行特征分类,实现物体的检测。实验结果表明,与其他流行方法相比,本文所提出的方法获得了最高的检测准确率。