论文部分内容阅读
当今社会,计算机的发展可谓是一 日千里,人们利用计算机从生活中获得了越来越多的信息。比如在计算机视觉领域中,随着计算机软硬件的发展以及数码产品的普及,图像的数量以及维数每年以指数次方的速度增加。图像的维数越高,包含的信息就越丰富。然而并不是所有的信息都是有用的,高维图像数据中同样包含了大量的冗余信息。我们在处理图像的过程中,这些无用的信息常常会带来许多棘手的问题。因此,在处理图像之前经常需要执行降维操作。经典一维线性降维方法,如PCA、LDA等。二维方法,如2DPCA、2DLDA等。还有以L1-范数为度量准则的方法,如PCA-L1、MMC-L1等。它们在许多场景中都取得了很好的效果。但是传统LDA对于多分类比较薄弱,这是由于它的目标函数中过分强调离中心间距大的类别,导致在特征空间中可以很好的分离离中心间距大的类别,却容易混淆离中心间距小的类别。而且以L1-范数为度量准则的方法由于L1-范数存在绝对值符号,难以直接求解目标函数。很多以L1-范数为度量准则的方法都采用贪婪策略逐个地求解每一个投影方向,这种做法所求得的最优解容易陷入局部值。针对这些方法的不足,一些基于加权的降维方法提了出来,如ILDA等方法,其主要思想是重新定义了目标函数,弱化离样本总体中心比较远的类别并且强调离样本总体中心比较近的类别对最终投影方向的影响,避免了离样本总体中心比较近的类别在降维后混叠在一起。同时还有一些基于非贪婪思想的降维方法被提了出来,如NPCA-L1等方法,这些方法的优点在于可以同时优化整个投影矩阵。此外,一些基于最大最小思想的降维方法已经被应用于许多场景中,并且取得了不错的效果。如CLMLDA、RMMLDA等。通过对上述方法的研究以及针对它们的不足之处,我们提出了以下三种改进方法:(1)针对MMC-L1降维前需要将图像矩阵向量化,导致破坏了图像的空间结构信息以及2DMMC对噪声鲁棒性较差并且处理多分类比较薄弱的问题,提出了基于L1-范数的二维加权最大间距准则(2DWMMC-L1)。该方法具有三个优点:一是以L1-范数为度量准则,增强算法的抗噪能力。二是避免将输入样本拉成向量形式,直接在样本矩阵上进行投影,以免破坏样本矩阵的空间结构信息。三是重新定义目标函数,弱化离样本总体中心比较远的类别并且强调离样本总体中心比较近的类别对最终投影方向的影响,避免了离样本总体中心比较近的类别在降维后混叠在一起。最后,给出求解目标函数的方法以及单调性证明。(2)由于传统基于L1-范数的降维方法中存在绝对值操作,不易直接求解目标函数的最优解。因此,很多基于L1-范数的降维方法都采用贪婪策略逐个地求解每一个投影方向,这种做法所求得的最优解容易陷入局部值。所以我们提出了基于L1-范数的二维非贪婪加权最大间距准则(2DNWMMC-L1)。相比较传统的2DWMMC-L1方法,该方法最突出的亮点在于可以同时优化所有的投影向量,寻求更好的投影矩阵。(3)通过将max-min的思想引入MMC-L1中,提出了基于L1-范数的非贪婪最大最小间距准则(NMLM-L1)以及二维扩展版本。该方法充分利用max-min的思想以及MMC-L1的优点,并采用非贪婪的优化算法求解目标函数。