基于l0惩罚下的主成分分析与线性判别分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ntfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了高维情形下基于l0惩罚的稀疏主成分分析与稀疏线性判别分析.主成分分析和线性判别分析是常用的统计线性降维工具,在生物学、工程学和社会科学等各个领域中得到了广泛的应用.然而,当数据的维数逐渐增加,尤其是当维数超过观测值的数目时,这两种方法的效果会大大减弱.这是由于高维数据的协差阵可能是奇异的,常规算法在准确性上有所欠缺,最终导致不相合的估计结果.此外,它们都是原始变量的非稀疏线性组合,在高维情况中往往缺乏解释性.为了解决上述估计结果的相合性以及可解释性问题,本文引入了稀疏主成分分析算法和稀疏线性判别分析算法,即考虑原始变量的稀疏线性组合.在这种情况下,主成分和判别向量的载荷中绝大部分都是0,这极大地增加了估计结果的可解释性.然而,现有的绝大多数算法都是基于l1或者l2惩罚,这不可避免地会造成了一些信息损失.本文通过直接求解基于l0惩罚的优化问题来得到稀疏的主成分和判别向量.本文基于l0惩罚与增广拉格朗日法相结合,提出了一个新的稀疏正交的主成分分析算法和稀疏线性判别分析算法.在稀疏主成分算法中,本文所提出的方法不仅保留了主成分载荷矩阵的正交约束,而且可以同时计算多个主成分,从而极大地提高了估计精度.在理论研究中,本文给出了估计量的极小极大化下界和上界.在稀疏线性判别算法中,我们使用组间方差矩阵的一个正定估计来解决矩阵奇异的问题,然后开发了一个高效的算法来计算稀疏判别向量.最后的数值模拟以及实际数据应用表明,我们所提出的方法可以得到更小的估计误差从而优于一些现有的方法.
其他文献
随着医疗行业全面进入大数据时代,人们愈发期望借助人工智能技术来构建自动化的临床决策支持系统,辅助医生完成诊断决策。然而,现有系统设计出的诊疗方案经常由于无法兼顾到疾病间复杂的并发关系而失去实用价值。事实上,揭示疾病间潜在的并发关系不仅是保证当前诊疗方案有效性的重要前提,也是对病情发展进行前瞻性预防和控制的理论基础。传统方法通常基于对照性医学实验和严格的因果推断来开展并发症研究,但这往往意味着反复的
学位
文中针对道路标线中专用的蓄能发光材料进行制备,并进行了基于单因素及正交试验的配伍性研究、路用安全性研究。结果表明:除掺量因素外,道路蓄能发光粉的颜色与粒径也是影响涂料性能的重要因素,基于道路安全角度的道路专用蓄能材料最佳配伍掺量为:夜光粉27%,钛白粉5%,气相二氧化硅0.8%,玻璃粉50%,成膜物20%,成膜助剂3%,消泡剂0.6%,流平剂0.6%;该掺量下的道路蓄能材料不仅满足规范规定,更具有
期刊
本文将主要研究一类带权值不等式的对称破缺问题,对不等式的最优函数和最优常数取值等问题具有重要意义。对于不等式的取等函数,通常被称为最优函数,可视为是原不等式一阶变分问题的临界点。由于不等式中权值的出现,往往意味着所得到的Euler-Lagrange方程是带有权值的,这样很难去通过以往传统的方法,如重排不等式或者移动平面法去直接处理问题。我们将利用一些变量代换的方法将不等式中所出现的权值统一,这样往
学位
现代风险管理通常需要对多种维度下的风险进行评估.由于金融机构面临相互依存的风险,对金融机构进行单独地监管往往不足以预防金融危机.因此在金融危机之后,人们对衡量系统风险产生了兴趣.学者们提出了很多方法来衡量系统风险,例如条件在险价值CoVaR(conditional value-at-risk)和条件期望短缺CoES(conditional expected shortfall).衡量系统风险往往需
学位
图像分割是图像处理中的重要研究方向,通过对原始图像进行图像分割后能够提供精简有效的图像特征信息,在计算机视觉领域有着十分重要的作用。图像分割的目标是把图像分割成若干个各具特性的区域,并从中提炼出所需信息的方法。将统计学习中的聚类算法应用于图像分割的方法有很多但它们大都未考虑图像数据中存在着同一目标区域相邻像素点之间具有强相关性、存在噪声、数据规模大等特点,以及期望分割的结果在图像空间上连续。本文在
学位
一些机器学习方法默认 训练数据和测试数据来自同样的分布,现实中我们不能确保数据满足这种假设.在实际中我们获得的训练数据也可能不是来自同一个分布,训练数据内部可能存在多个分布不同的来源,所以我们要考虑测试数据和多源训练数据分布不同的数据背景,本文关注协变量移位情形.除此之外,现实中各数据来源往往不愿意将自己的数据透露出去,这时多个数据来源宛若一座座数据孤岛,我们无法将这些孤岛的数据汇总在一起进行训练
学位
随着我国经济实力的大幅提升,我国金融市场规模迅速发展、金融产品日益丰富、金融体系不断完善,为国民经济提供融资便利、提高资源配置效率等发展基础。金融风险与金融市场相伴相随,我国金融市场不断发展的同时也面临更严峻的风险挑战。2015年我国股市出现大幅波动,对我国实体经济造成巨大损失。我国也一直非常重视金融风险管理,2017年全国金融工作会议强调“防范发生系统性金融风险是金融工作的根本性任务”。准确度量
学位
<正> 近年来,笔者以丹芎煎剂为主,配合含服速效救心丸治疗经久不愈之血管性头痛20例,收到较好疗效。现报道如下。一般资料本组病例中,男性5例,女性15例;年龄最小者31岁,最大者50岁;病
期刊
凸几何是现代几何分析领域的一个重要分支,主要研究对象是凸体和星体,其核心内容是Brunn-Minkowski理论。Aleksandrov问题,又称为预定积分高斯曲率问题,是Brunn-Minkowski理论研究的核心问题之一,是凸体的刻画问题,主要涉及解的存在性、唯一性、连续性、正则性等。本文主要研究Aleksandrov问题解有C~0估计的充要条件。在凸几何中,Aleksandrov问题被描述为
学位
大数据时代的到来对我们数据分析适用的范围和领域提出了很高的要求,尤其是在变量个数N与样本个数T相近的情况下,经典统计理论的应用遇到了极大的挑战。本篇论文主要是以金融领域的投资组合问题为切入点,对随机矩阵理论应用于高维极限时的进展作一个总结,以读书报告的形式阐述该问题解决的方法和逻辑。我们会先介绍随机矩阵的基础相关结论,包括最重要的Wishart条件概率分布,以及Stieltjes变换。紧接着通过假
学位