论文部分内容阅读
图像分类在计算机视觉研究领域中是一个热点问题,一直以来备受学者关注,尤其是近些年来,数字图像的规模呈现爆炸式增长态势,图像分类已成为许多领域的一项关键任务,因此其研究的价值和意义变得越来越重要,各种新的分类技术纷纷被提出。目前,应用最广泛的图像分类系统的处理流程是先对图像提取局部特征,然后通过不同的编码技术编码成固定长度的高维向量,接着通过空间聚合(pooling)方法生成图像级别的全局特征表达,最后训练分类器进行分类。这一过程中,研究者们往往将研究重点集中在编码、聚合算法及分类器的改进创新上,而本文对图像分类的研究则将重心放在特征提取阶段,旨在选择最具判别力的局部特征子集编码聚合成Fisher向量。这是因为如今的图像采集设备配置参数及拍摄者水平参差不齐,图像质量差别很大,造成许多噪声特征存在,而且位于图像不相关区域及背景中的大部分特征并不能给分类提供有用的判别信息,甚至会产生严重的干扰,若这部分特征也作为图像表示的一部分将会使图像描述产生偏离,造成后续的一系列工作结果失准,从而降低图像分类准确率,同时也会增加分类任务的计算复杂度。鉴于上述问题,本文提出了两种自适应的特征选择方法,一种是基于贝叶斯自适应算法的特征选择方法,另一种是基于显著区域提取的特征选择方法。并将它们分别引入到Fisher向量的生成过程中,以实现对图像分类系统的改进。论文的主要工作包括如下几方面:1.设计了一个手动特征选择系统,手动选择局部特征子集聚合生成图像全局特征表达,并在小规模数据子集上进行分类实验,验证了特征选择思想对提高图像分类准确率的有效性。2.基于贝叶斯自适应算法,提出了一种自适应特征选择方法,只保留判别力强的局部特征子集,通过Fisher编码算法生成图像全局特征表达,即Fisher向量,在Caltech256, PASCAL VOC2007及BMW数据集上进行分类实验,并从算法的适用性和扩展性两方面进行全面分析总结。3.提出了一种基于显著区域提取的特征选择方法,利用空间信息来去除背景的无用特征,从而生成理想的局部特征子集,并在分类实验上进行了验证,针对分类性能进行了详细分析和深入讨论。实验表明,将本文提出的两种特征选择方法引入到Fisher向量的生成过程中后,能得到更具判别力的理想图像全局特征表达,因而与简单线性分类器结合就能取得很好的性能。而且这两种方法对低分辨率、低质图像的分类有着很好的适用性。