论文部分内容阅读
                            
                            
                                高维度和稀疏性是当今机器学习研究领域的重要话题。图像的稀疏表示是当前信息科学飞速发展、图像数据急剧增加的形势下对图像表示问题的研究热点。稀疏性能有效解决实际应用中图像这种高维数据在存储容量、处理速度和数据本身的可解释性等方面存在的问题。为了适应大规模基于内容的图像检索和图像分类任务的应用需求,本文在提取图像局部特征的基础上,研究了无监督的特征学习方法来获得图像的全局超完备稀疏表示,使之同时具备了全局特征和局部特征的优势。本文的主要研究工作包括:对图像局部特征提取技术进行综述,介绍了一些有代表性的局部特征提取算法(包括特征检测算子和描述算子),指出了局部特征的应用场合,引出了本文的研究动机。针对图像局部特征集表示在大规模图像检索和分类应用中的局限性,研究了基于视觉词袋(BoVW)模型的图像稀疏表示方法,该方法以特征量化为核心思想,其关键技术包括基于聚类分析的视觉词典构造、基于向量量化技术的特征编码等。针对BoVW模型中特征量化误差较大的问题,研究了基于稀疏编码(SC)模型的图像稀疏表示方法,该方法以稀疏重构为基本准则,其关键技术涉及超完备视觉词典学习、稀疏分解和编码集成等。针对SC模型中稀疏性正则化函数不平滑及计算复杂度较高的问题,研究了基于局部编码(LC)模型的图像稀疏表示方法,该方法以流形学习为理论基础,用局部性约束替代稀疏编码中的稀疏性约束,以局部重构的方式实现了高效的特征编码,形成图像的稀疏表示。综合以上三种图像稀疏表示模型,建立并推广了图像稀疏特征学习的统一框架,探讨了各种模型在此统一框架下的具体表现形式和实现方法,提出了一种基于图像异质局部特征的稀疏学习方法。本文以基于内容的图像检索和图像分类任务为应用背景,在ZuBud、UKBench、Caltech-101、Scene15等标准数据库上验证并评价了所研究的稀疏特征学习方法。本文的主要贡献在于:提出了一种基于谱聚类的视觉词典构造方法,谱聚类可在任意分布的样本空间收敛到全局最优,避免了K-Means和HKM聚类算法对初始聚类中心敏感和局部最优的问题;提出了一种在优化函数中施加非负性约束来增强图像稀疏特征学习性能的策略,对标准稀疏编码(SC)模型进行改进,建立了非负稀疏编码(NNSC)模型,对局部编码(LC)模型中的LLC编码方法进行改进,提出了非负LLC(NNLLC)编码方法;提出了一种改进的基于向量差分运算的局部编码方法,即局部差分编码(LDC),仅用图像局部特征的近邻视觉单词来构造差分基向量用于后续编码,以保持其局部平滑性,将视觉单词之间的关系融合到最终的特征编码中;提出了一种改进的特征集成策略,即kMaxSum Pooling,考虑图像中所有局部特征相对于视觉词典中某个视觉单词的前k个最大响应,并求其和响应,选择合适的k值后在图像检索实验中取得了比Max Pooling和Sum Pooling更好的效果;从三种稀疏表示模型的联系出发,建立了图像稀疏特征学习的统一框架,并引入图像异质局部特征的概念推广了该框架,提出了一种基于图像异质局部特征的稀疏学习方法形成图像的多角度全局稀疏表示,提升了图像检索和图像分类的性能。