论文部分内容阅读
随着人类进入互联网信息爆炸时代,所接触的信息种类也越来越多。比如从最开始简单的文本信息,发展到随后的音频信号,再到现如今含有丰富内容的图像。人类获得信息的途径越来越多,获得的内容也越来丰富。在所有信息传播的途径中,图像信息由于其丰富的内容,以及生动的表达能力已成为当今互联网信息传播的主流。然而随着图像信息在互联网中的爆炸式传播,人们已经不能有效的从中寻找出自己想要的数据。尤其是当图像数据众多,且图像信息存在大量冗余的时候,人类很难从大量图像数据中迅速地识别出自己所感兴趣的内容。更严重的是,由于每个人在认识事物方面存在差异性,图像的识别往往受到个体差异性的影响,并且识别精度也不太稳定。因此如何依靠计算机对图像进行有效的分析和识别成为解决这类问题的关键。近年来四元数在彩色图像识别中的应用引起了国内外学者的广泛关注。在本文中我们会介绍四元数的代数理论然后以此为基础阐述四元数主成分分析在彩色图像分类中的应用。我们通过Georgia Tech Face彩色人脸数据对传统的主成分分析,线性判别分析和四元数主成分分析进行对比并且给出了详尽的实验结果。自编码技术是近些年发展较快、势头较猛的深度学习的一个分支,他并没有像四元数主成分分析、主成分分析和线性判别分析那样需要人工指定如何去提取特征,而是采用了自学习的办法,从给定的图像数据中学习出这组图像的本质特征,然后再将这些特征应用在图像识别领域。主成分分析网络就是一种新型的自编码机。该网络主要分为三部分:卷积层、滤波器算法和最后的特征图像编码。我们在CURet彩色纹理数据库上研究了主成分分析网络对于各个彩色空间中的彩色图像的分类表现,指出了主成分分析网络的最优彩色空间并且分析了主成分分析网络在彩色空间上的彩色滤波器。由于主成分分析网络一直应用在灰度图像识别领域,因此如何对主成分分析网络进行改进,使其能够更好的对彩色图像进行特征提取,是本文的主要研究内容。在本文中,我们基于四元数主成分分析理论,对传统的主成分分析网络进行了改进,使得改进后的四元数主成分分析网络相比较原来的主成分分析网络能够对彩色图像能够进行更有效的特征提取,从而能够对彩色图像进行更精确的分类。四元数主成分分析网络采用四元数彩色RGB图像作为网络的原始输入。在滤波器的使用上我们采用了四元数主成分分析。卷积层我们使用四元数域乘法实现二维卷积操作。在最后的特征编码层,四元数特征图被进行二值化后,用加权的方式得到彩色图像最终所对应的特征向量,然后使用大规模支撑向量机进行分类。在文中我们使用Caltech101, UC Merced Land Use, Georgia Tech Face彩色图像数据库测试四元数主成分分析网络的识别性能,并与原始的主成分分析网络进行了详尽的对比。实验结果表明四元数主成分分析网络在彩色图像识别方面优于传统的主成分分析网络,当彩色图像含有较多的旋转图像信息的时候,这种优异性更加得以体现。由于我们提出的四元数主成分分析网络的工作对象是处理普通的平面彩色图像,不具有处理日常多维视觉信息的能力。在本文中,我们对传统的张量降维算法(多线性主成分分析和多线性判别分析)进行了卷积网络结构化的扩展,得到多线性主成分分析网络和多线性判别分析网络。我们提出的两种网络能够对张量数据进行更有效的特征提取,我们随后在UCF11和UCF Youtube视频数据上对这两种新提出的算法进行了详细的测试。实验结果表明,应用结构化的张量特征提取算法提取出来的特征远远优于传统的张量特征提取算法。新算法提取出来的特征能够使用分类器进行有效的分类,并获得非常高的分类精度。