基于L1-范数的二维非贪婪加权最大间距准则研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:quguangming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,计算机的发展可谓是一 日千里,人们利用计算机从生活中获得了越来越多的信息。比如在计算机视觉领域中,随着计算机软硬件的发展以及数码产品的普及,图像的数量以及维数每年以指数次方的速度增加。图像的维数越高,包含的信息就越丰富。然而并不是所有的信息都是有用的,高维图像数据中同样包含了大量的冗余信息。我们在处理图像的过程中,这些无用的信息常常会带来许多棘手的问题。因此,在处理图像之前经常需要执行降维操作。经典一维线性降维方法,如PCA、LDA等。二维方法,如2DPCA、2DLDA等。还有以L1-范数为度量准则的方法,如PCA-L1、MMC-L1等。它们在许多场景中都取得了很好的效果。但是传统LDA对于多分类比较薄弱,这是由于它的目标函数中过分强调离中心间距大的类别,导致在特征空间中可以很好的分离离中心间距大的类别,却容易混淆离中心间距小的类别。而且以L1-范数为度量准则的方法由于L1-范数存在绝对值符号,难以直接求解目标函数。很多以L1-范数为度量准则的方法都采用贪婪策略逐个地求解每一个投影方向,这种做法所求得的最优解容易陷入局部值。针对这些方法的不足,一些基于加权的降维方法提了出来,如ILDA等方法,其主要思想是重新定义了目标函数,弱化离样本总体中心比较远的类别并且强调离样本总体中心比较近的类别对最终投影方向的影响,避免了离样本总体中心比较近的类别在降维后混叠在一起。同时还有一些基于非贪婪思想的降维方法被提了出来,如NPCA-L1等方法,这些方法的优点在于可以同时优化整个投影矩阵。此外,一些基于最大最小思想的降维方法已经被应用于许多场景中,并且取得了不错的效果。如CLMLDA、RMMLDA等。通过对上述方法的研究以及针对它们的不足之处,我们提出了以下三种改进方法:(1)针对MMC-L1降维前需要将图像矩阵向量化,导致破坏了图像的空间结构信息以及2DMMC对噪声鲁棒性较差并且处理多分类比较薄弱的问题,提出了基于L1-范数的二维加权最大间距准则(2DWMMC-L1)。该方法具有三个优点:一是以L1-范数为度量准则,增强算法的抗噪能力。二是避免将输入样本拉成向量形式,直接在样本矩阵上进行投影,以免破坏样本矩阵的空间结构信息。三是重新定义目标函数,弱化离样本总体中心比较远的类别并且强调离样本总体中心比较近的类别对最终投影方向的影响,避免了离样本总体中心比较近的类别在降维后混叠在一起。最后,给出求解目标函数的方法以及单调性证明。(2)由于传统基于L1-范数的降维方法中存在绝对值操作,不易直接求解目标函数的最优解。因此,很多基于L1-范数的降维方法都采用贪婪策略逐个地求解每一个投影方向,这种做法所求得的最优解容易陷入局部值。所以我们提出了基于L1-范数的二维非贪婪加权最大间距准则(2DNWMMC-L1)。相比较传统的2DWMMC-L1方法,该方法最突出的亮点在于可以同时优化所有的投影向量,寻求更好的投影矩阵。(3)通过将max-min的思想引入MMC-L1中,提出了基于L1-范数的非贪婪最大最小间距准则(NMLM-L1)以及二维扩展版本。该方法充分利用max-min的思想以及MMC-L1的优点,并采用非贪婪的优化算法求解目标函数。
其他文献
针对上市公司现金持有问题,学术界提出了四个相关的假说,即交易动机假说、预防动机假说、税收动机假说以及代理成本假说。同时,学者们注意到文化因素作为社会学的一个重要内
背景:甲状腺疾病在世界范围内女性发病率比男性高,是除糖尿病外第二常见的内分泌疾病。甲状腺疾病根据碘含量分布的不同,在不同的大陆、种族、国家、甚至同一国家不同地区,其
吸波材料,是指能吸收或者大幅减弱辐射到它表面的电磁波能量,从而减少电磁波干扰的一类材料。吸波材料主要通过材料的电磁损耗来吸收入射电磁波的能量,发展至今已有许多种类
PbS胶体量子点(PbS CQDs)因具有包括禁带宽度可调、宽带光吸收、可溶液加工制备和潜在的多激子产生效应等在内的优异性能,可用于低成本的下一代电子和光电子器件,尤其是新型
本文以从传统馒头发酵剂酵子中分离、筛选得到的一株优势醋酸菌菌种A3为研究对象,通过对其生理生化特性与16S rRNA基因序列的分析,确定菌株A3为一株热带醋杆菌(Acetobacter tr
目前,我国大型火力电站的运行主要依靠煤炭资源和水资源。在我国煤炭资源丰富的三北地区,水资源的短缺严重限制了大型坑口电站的发展。为缓解日益突出的电站缺水问题,大量节
雄性不育突变体是研究植物雄配子发育调控机制的宝贵试材。在前期研究中,本实验室对大白菜雄性不育甲型两用系‘AB01’的不育株和可育株花蕾分别进行转录组测序,鉴别出系列差
叶色是大白菜最重要的农艺性状之一,对其产量和品质等方面产生重要影响。叶色突变体是植物叶色研究中的优良材料,不仅在生产实践中有着广泛的应用,而且对于探究植物的光合机
松山新城是明长城天祝段的重要组成部分,在经历了400多年的人为及自然因素的破坏后各种病害严重发育,其中尤以坍塌和底部掏蚀两种病害发育最为严重。在工程修补措施中针对这
中水处理和人类的生活息息相关,它在企业未来发展的道路上发挥了决定性作用。面对不断发展壮大的中水处理项目和技术工艺的不断优化,项目管理已成为工作的重心。因此,在项目