论文部分内容阅读
图像具有丰富的内容和直观的描述能力,作为视觉信息获取的一个重要来源,是人类活动中最常用的信息载体。随着科学技术的发展,利用计算机处理图像已经成为视觉分析和机器学习领域的重要研究内容,具有切实的应用需求。如何对图像进行更加合理且准确的表示,才能更好的反映图像的表观信息和语义信息,是视觉表示和学习的关键科学问题。图像表示作为图像处理的一个基础部分,其表示能力对图像分类和识别的性能有着决定性的影响。由光照、姿态、场景变化等现象造成的视觉内容的复杂性和多样性,图像表示技术的研究一直是一项十分困难且极具挑战性的课题。本文基于矩阵的低秩表示、稀疏表示、非负矩阵分解三个基本方法,针对诸如人脸图像、乳腺癌病理图像和多类别物体图像等构建有效的图像表示方法,达到提高图像分类性能和识别性能的目的。本文的主要贡献如下:(1)本文第二章提出了一种基于矩阵深度低秩分解的图像表示方法。不同于其它针对字典和对表示矩阵加额外限制的低秩表示学习模型,本文所提方法采用迭代的方式对表示矩阵进行低秩分解,使新的表示矩阵的秩越来越低,从而避免了由于参数选择的不合理造成的图像表示能力下降的问题。首先,针对数据库样本被大量损坏的情况,构建第一个低秩表示模块,该模块对限制稀疏噪声的参数设定较小的值,选择整个数据集合本身作为字典,输出表示矩阵和噪声。然后,将这些去噪后的图像作为字典输入到第二个低秩表示模块中,对第一个模块的系数矩阵再次进行低秩分解。最后,重复模块间的低秩分解操作,直到表示矩阵的秩达到理想水平。相比于标准的低秩表示方法,所提深度低秩分解框架在Extended Yale B数据集分类任务上提高了16.43%的性能,有效实现了对严重污染数据库的去噪和分类的任务。(2)本文第三章基于颜色反卷积,将矩阵的低秩表示、非负稀疏低秩表示和深度低秩分解三种方法应用于乳腺癌染色病理图像的表示学习,得到基于这三种方法下细胞的分割结果,其中第二章所提出的基于矩阵深度低秩分解方法的细胞分割效果最优。首先,采用Lambert-Beer定律将被苏木素-伊红(Hematoxylin-Eosin,简写H&E)染色的RGB空间加强图像转变成光密度图像生成颜色矩阵。然后,分别利用矩阵的低秩表示、非负稀疏低秩表示、深度低秩分解方法分离H&E染色图像中的被H和E染色的部分,将RGB空间的被H染色的图像进行重建,并转化成灰度图像再进行二进制表示。最后,应用数学形态学确定细胞核轮廓,并利用分水岭算法完成细胞核的分割过程。上述三种方法能够对乳腺癌病理图像中的细胞进行有效分割和提取,为医学图像处理领域中细胞的后续定量分析打下基础,也对最终诊断疾病的准确率有较大帮助。(3)本文第四章提出了基于半监督低秩表示和稀疏分解的图像相似度表示方法。该方法利用标签数据中所包含的信息,将少量标签数据的信息和大量未标记数据中的隐含信息结合起来对图像相似度权重系数进行学习。相比于仅使用一种数据来源,所提方法得到的图像相似度信息更好地适应了复杂内容,并具有更好的语义一致性。首先,对传统的低秩表示相似度学习方法加入标签信息限制,采用合理的凸函数进行近似,并使用基本的增强拉格朗日算法近行优化。然后,对所得算法加入非负和稀疏的约束条件,构建对应的凸函数并进行优化学习,所得到的图像相似度表示不仅包含图像的局部特征和全局特征,还包含了图像语义的一致性信息。最后,构建基于含有标签信息的非负稀疏低秩约束的相似度图,图中所有的节点代表图像,通过对各个节点的重构系数施加非负、稀疏、低秩限制来寻找图中的权重系数。此图一方面保证了当前节点可仅用极少数几个其它节点来表示,另一方面保证了捕获图像全局结构信息的同时兼顾捕获局部结构信息。(4)本文第五章设计了含可变参数?的半监督非负矩阵分解的图像表示方法。首先,对传统的非负矩阵分解表示加入标签信息限制,采用?散度作为距离度量的标准,得到相应的含有标签限制的非负矩阵分解表达式。所提方法通过设置不同的?值可等价于多种经典度量,相比于传统方法,是一种泛化的距离度量形式,能够更加有效地适应不同数据的分布特性。然后,利用Karush-Kuhn-Tucker条件和投影梯度方法求解含有参数?的最优化方程,并证明所得算法的收敛性。最后,在待测图像中评估算法分类质量时,设计出一个含可变参数?的适合不同数据库的算法,从而提高了半监督图像表示方法的判别能力。