基于近似零范数和无穷范数的维数约简

来源 :天津大学 | 被引量 : 0次 | 上传用户:xinkiss168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代来临的趋势已不可阻挡,信息量爆发式地增长一方面方便人们更加全面具体地观察事物,另一方面也增加了数据存储和计算的难度。维数约简作为一种能够有效降低数据维度的方法正越来越受到人们的关注。维数约简的方法包括主成成分分析(Principal Component Analysis,PCA)、线性判别分析(LinearDiscriminant Analysis, LDA)、典型相关分析(Canonical correlation analysis, CCA)和核主成成分分析(Kernel Principal Component Analysis,KPCA)等。与PCA是一种线性的维数约简方法不同,KPCA能够对非线性数据进行降维,其主要思想是将原始数据通过映射函数投影到高维特征空间,并在该特征空间进行线性的PCA处理,核函数的引入大大的降低了计算量。KPCA的降维过程是通过计算需要降维的样本与训练样本得到的主成分的线性叠加实现的,所以其计算量依赖于训练样本的大小,导使降维效率受到制约。为了提高KPCA特征提取的效率,本文提出利用近似的零范数表达式而不是传统的L1范数对主成分向量施加稀疏约束,能够得到具有良好稀疏特性的主分量。特征提取时,去除大量系数为零的训练样本,所以能够显著提高特征提取的速度。在ORL人脸数据库上的实验表明,本论文所提方法确实能够提高特征提取的速度。在实验中还发现这种算法具有不错的鲁棒性,能够较好的克服离群点的影响。线性判别分析(LDA)是监督式的特征提取方法,在人脸识别等领域得到了广泛应用。本论文为了提高特征提取速度,提出了基于无穷范数的线性判别分析方法。传统LDA方法将目标函数表示为类内散布矩阵和类间散布矩阵之差或之商的L2范数,且通常需要涉及到复杂的矩阵求逆和特征值分解问题。为了解决该问题,本文所提方法将目标函数表示为类内散布矩阵和类间散布矩阵之差的无穷范数,而且最优解是以迭代形式得到,避免了耗时的特征值分解。无穷范数使得到的基向量实现了二值化,即元素仅在-1和1两个数字内取值,避免了特征提取时的浮点型点积运算,从而降低了测试时间,提高了效率。在ORL人脸数据库和Yale数据库上的实验表明所提算法是有效的。
其他文献
矿产地质勘查工作本身是一项高风险、高投入、精确精密、不容失误的高难度工作,随着当代社会科学技术的不断发展,矿产地质勘查理论与技术方法也取得了长足进步.在地质勘查的
:胡尖山油田为采油厂主力油田,其中的侏罗系边底水油藏初期依靠自然能量开发,但由于初期采液、采油速度较高,部分边底水能量强、注采井网不完善,导致底水锥进边水内推,同时油
简单介绍井下试油工艺的原理和种类,分析几种传统的试油工艺的优缺点,重点介绍新形势下试油压裂新工艺的种类、应用特点和应用效果,证明其具有较强的推广价值.
随着互联网技术的不断发展,网络给人们的学习和生活带来了深远的影响.在高职院校的思想政治教育工作中,教师更应该要顺应时代发展,借助新媒体平台,制定行之有效的工作措施,实
卫星导航信号模拟器可以模拟真实的卫星导航信号,为研发接收机提供测试信号源。卫星导航的应用越来越广,各种类型的接收机也是层出不穷,而这些接收机的研制都离不开导航信号模拟
随着阵列信号处理的日益发展,其在现代信号处理的地位也越加显著,并在诸多领域,如:雷达、通信、射电天文以及医学诊断等得到了广泛应用。通过对传感器阵列赋以不同的系数获得最优
在注水开发油田生产时,对注水工艺技术予以优化,有助于实现最佳水驱效果.由于注水工艺技术的差异性,导致水驱效果也不尽相同.为此,需要对注水工艺技术展开研究,结合油田生产
闪光强度是各种弹体爆炸时刻的一个重要指标,实现对闪光强度的测量具有非常重要的意义。为了满足人们对闪光测量的需求,本文设计了一种宽量程、高精度的火光爆炸闪光强度测试
二次衬砌混凝作为隧道建设中最后一道防水结构,其重要性可想而知,但诸多实例指出钢筋混凝土在没有达到服役年限就提前失效,这其中除了人为及外界荷载变化的破外,大多是由于混
本文在分析农村生活污水特点的基础上,介绍了我国农村现有生活污水收集模式,概括了现有的生活污水处理技术现状,并给出农村生活污水治理对策建议.