论文部分内容阅读
随着图像获取技术的不断进步,大规模的图像数据不断涌现,因此利用机器学习对海量图像进行自动分类、标注与检索变得愈发重要,已成为当前研究的热点问题。传统的图像分类往往通过提取图像的颜色、形状、纹理等底层特征,但目前这些底层特征都有一定的局限性,并不能真正被人类视觉所理解,而稀疏编码能够较好的解决该问题。稀疏编码算法是一种典型的基于特征空间的分类方法,通过矩阵分解将图像分解为一组超完备图像字典集与表示系数的线性组合,以获取样本数据的高维语义特征,因此有望克服传统算法局限性较差的问题。基于上述原理,近年来许多基于稀疏编码的图像分类算法已被提出,其中迁移稀疏编码算法取得优异的成绩。然而,该方法仍然存在诸多问题,如忽略对图像流形结构信息、标签信息的获取,以及非线性分布的数据在原始特征空间可分性较差的问题。针对上述问题,在迁移稀疏编码的基础上提出了两种改进算法,以提高跨域图像分类的精度与鲁棒性。本文的主要工作如下:(1)图像数据样本是嵌入高维欧式空间中的低维拓扑流形结构。然而,传统跨越图像分类方法却往往忽略了图像数据分布的空间流形结构。此外,源域和目标域不同的标签往往在一些语义空间上相关,并且都对应着相同的特征空间,对分类结果往往具有重要意义,却在当前方法中并没有得到充分利用。针对上述问题,因此需要将数据重合度、标签关联等信息整合到一起来度量源域与目标域之间的分布差异。基于此,提出一种新的整合了流形学习和多标签学习的正则化迁移稀疏概念编码模型:通过将稀疏编码与概念基学习相结合,迁移跨域视觉信息,实现图像分类。实验表明提出的方法能取得更高的分类精度。(2)现有的迁移稀疏编码模型主要是在数据的原始空间进行分类,因此无法有效处理高度非线性分布的数据。针对这一问题,本文受核方法能够有效解决原始数据不能线性分离问题的启发,同时为了减少传统图像分类任务中过多的信息丢失、降低图像特征的重构误差等问题,在传统的线性算法中融入核方法,以学习更鲁棒性的稀疏编码。基于此,提出了一种融入核方法的核迁移稀疏编码算法。该算法既可以高效处理线性不能分离的数据,还考虑了数据的局部几何内蕴结构并最小化域间的数据距离,减少了重构误差,从而更能准确提取源域与目标域的共同特性,而不仅是单个域的特征。实验表明所提算法能够取得更好的分类效果。