论文部分内容阅读
随着特征学习理论的研究与发展,稀疏编码作为一种高效简洁的特征学习算法受到了广泛的关注。稀疏编码模拟生物的视觉感知系统中视觉皮层简单细胞只对具有特定方向及宽度的刺激做出反应的特性,利用少量相似原子实现对信号的稀疏表示。作为一种简洁的图像表示方法,稀疏编码能够学习到视觉信息的本质特征。本文基于稀疏编码的理论,从多个方面进一步研究了该方法在图像鲁棒性特征提取中的应用性能。本文首先对现有的特征提取方法进行了介绍,包括传统手工设计的特征提取方式及特征自学习算法。对于特征自学习算法,主要介绍了稀疏编码、生成模型两种方法。深入分析了稀疏编码的生物学背景,介绍了算法模型、求解方式及针对不同问题的字典学习算法等内容。为了进一步将稀疏编码引入生成模型的构建,本文对生成模型相关算法也进行了概述。基于现有的理论基础,本文提出了一种鲁棒的分层稀疏表示模型,并应用于图像指纹的提取。为了加强算法对噪声的抵抗能力,字典学习及编码过程均加入若干约束条件,包括在编码原子选择上加入近邻优先原则,字典学习过程加入对原子去相关的操作,以及强调编码结果间的距离与样本空间内距离的一致性。为了更好的模拟视觉系统层次化信息处理方式,算法采用分层的编码结构,实现对图像的本质特征提取。实验中,将本算法应用于包含219,000张图像的测试集,并与其他多种代表性的指纹提取方法进行比较。实验结果证明了算法在不变性指纹提取中的有效性,在图像拷贝检测实验中测得算法等错误率低至10-3量级。本文进一步将稀疏约束引入生成模型的学习过程,实现对稀疏专家乘积系统(Products of Experts,PoE)的构建,并将该算法用于组织病理图像分类。算法从图像概率分布的角度出发,利用PoE模型对健康及患病组织的病理图像进行概率建模。在模型构建中加入对专家函数的稀疏性约束,保证了各专家对图像概率分布的表示能力。模型将样本在健康及患病模型下的专家值相连作为其特征表示,实现了病理图像特征的自学习。算法利用PoE模型的输出,分别设计了像素块及图像级别的分类机制。该算法对多种器官的病理图像均具有较好的分类效果,证明了其对病理图像特征提取的有效性及对于不同类别病理图像的适用性。