正则化的单边二维线性判别分析

来源 :云南财经大学 | 被引量 : 1次 | 上传用户:html007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
判别分析的理念是在样本类别信息已知的情况下,建立判别分析模型来判别新观察的所属类别。判别分析同时也是数据预处理环节中的降维手段之一,它是一种有监督的分类。通过提取出最有利于分类的特征,以此空间做分类,这即是判别分析的主要任务。另外,本文考虑把在向量基础上的特征提取视作一维方法,把在矩阵基础上的特征提取视作二维方法。一维方法例如线性判别分析(LDA),其方法的目的就是确认出如何让费舍尔准则函数取出极值,并以取到此极值的向量即为最佳的投影方向。这样会改变样本在此最佳投影方向上的投影,使其具有最大的类间散布的同时也具有最小的类内散布。二维方法例如二维线性判别分析(2DLDA),是LDA处理矩阵型数据上的拓展,2DLDA最突出的优点是无需考虑如何把高维矩阵型数据转变成向量,故可以达到降低计算量这一目的。同时,一部分通过引入正则化过程的判别分析算法也被提出与优化,其考虑带来的额外信息进行新的估计。然而,无论是已有的单边二维判别分析还是正则化判别分析,都分别存在着较高维度的类间和类内散布矩阵、特征维数较大等缺陷,为了进一步在特征提取上更加高效准确,故通过拓展正则化的判别分析到单边二维线性判别分析,得到了正则化的单边二维线性判别分析(R2DLDA)。主要研究方法为在单边二维线性判别分析的基础上,加入正则化过程,正则化过程通过交叉验证的方法确定最优正则化参数?,后寻找最佳投影矩阵,进而判断分类效果。后续本文为了验证R2DLDA的判别分类性能,考虑通过数据加以验证,即选取了五个真实数据集,设计实验,并分别在这些数据集上加以实验。通过实验及得出的相应降维结果与分类错误率,同2DLDA、2DPCA进行对比,证实了R2DLDA其在分类准确率及降维的效果上是更优秀的。
其他文献
鉴于目前各大城市机动车年保有量快速增长,尾气排放的颗粒物和挥发性有机物(VOCs)已成为城市区域大气污染的主要贡献源,而目前对尾气直接排放的不同粒径的颗粒物浓度和有机胺成分的研究有限,对交通环境中不同站点的VOCs的排放特征尚不清晰。本研究以区域空气污染频发的典型城市-济南市为代表,开展了三个与机动车尾气排放有关的实验。实验一研究了尾气中PM2.5质量浓度、PM10质量浓度和PM0.01-1数浓度
易地移民搬迁作为我国精准扶贫战略的“五个一批”工程之一,近年来取得了巨大成绩,基本实现了“搬得出、稳得住、能致富”的目标,为2020年全面建成小康社会打下了坚实基础。
摘 要:后脱贫攻坚时代,中国农村反贫困形势进入绝对贫困与相对贫困并存的新阶段,面临着新形势:“两无人口”数量巨大,兜底脱贫压力激增,相对贫困问题更加突出,已脱贫人口返贫风险大,农村贫困人口追求美好生活的愿望更加强烈。当前中国农村社会救助政策运行中也存在着一些突出问题,反贫困“造血”功能不足,救助标准过低,兜底脱贫作用有限,救助政策简单叠加,能力提升政策缺失,低收入群体争当“贫困户”。面对后脱贫攻坚
我国社会在不断的发展,人们对建筑的要求越来越高。传统的施工管理技术已经不能满足社会发展的需要。智能化项目的管理是现代建设项目管理的主流。我国的科学技术在快速发展,
马来西亚登嘉楼开启桥项目P4主墩东侧的小型高桩码头,基础桩为PHC桩,采用现浇梁板式结构。码头PHC桩通过打桩船施打,上部结构施工平台采用抱箍作为支点,因斜桩轴线为单根桩,
贫困问题是人类面临的共同挑战。虽然我国减贫事业取得了辉煌的成绩,但脱贫摘帽形势依旧面临重大挑战,不可小觑。2020年我国要实现全国人口脱贫大关,目前我国部分人口贫困状况甚至比想象中更严重,贫困人口的脱贫致富能力及意志力更弱,更存在着因不可抗拒因素无法彻底摆脱贫困的问题。自2012年中国共产党第十八次全国代表大会以来,以习近平总书记为核心的党中央对脱贫攻坚战高度重视,为全面建成小康社会,为贫困县全部