协方差矩阵的几何型收缩估计及其应用

来源 :浙江工商大学 | 被引量 : 3次 | 上传用户:yaoyao115711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协方差矩阵不仅刻画了各变量的离散程度,还刻画了变量间的线性相依关系,在多元统计分析中占据着重要的地位。例如,在总体主成分分析(或因子分析)中,根据协方差矩阵的特征根大小来挑选重要的主成分(或主要因子);在线性判别分析(LDA)中,判别函数包含有协方差矩阵;在探索性的数据分析和检验中,变量间的独立性和条件独立性关系采用协方差矩阵来度量;在置信区间的构建中也包含协方差矩阵。因此,对协方差矩阵的估计是一个非常重要的问题。众所周知,当总体的维数p很小时,样本协方差矩阵是总体协方差矩阵的优良估计(如相合估计,无偏估计,一致估计等)。但是随着总体的维数p逐渐增大,样本协方差矩阵变得越来越不稳定,样本协方差矩阵的最小特征根比总体协方差矩阵的最小特征根小得多,而最大特征根则大得多。其次,随着P逐渐增大,总体协方差矩阵的待估参数增加得很快(参数为O(p2)个)。待估参数增加,干扰的信息过多,导致估计误差的增大。这样,随着p的增大,样本协方差矩阵不再是总体协方差矩阵的良好估计。特别地,当总体的维数P大于样本的容量n,即p>n时(此时对应的协方差矩阵的估计称为高维协方差矩阵估计),样本协方差矩阵是奇异的。通常,在理论研究和实际应用中,我们假设总体协方差矩阵是正定矩阵,这样,用一个奇异的矩阵来作为一个正定矩阵的估计明显是不合适的。总之,寻找高维协方差矩阵的优良估计在现代统计学中具有重要的理论意义和实践意义。高维总体协方差矩阵的估计问题是现代统计学中的核心问题,也是一个十分具有挑战意义的问题。近十多年来许多学者都致力于改善高维总体协方差矩阵的估计,提出了许多估计方法。常见的方法有正则化方法,收缩方法,在估计总体协方差矩阵时引入某种模型来描述变量之间的相关关系等方法。尽管这些特定方法具有很多优良性质,但是同时也存在着明显的缺陷。例如,banding方法和thresholding方法无法保持估计矩阵的正定性;tapering方法和thresholding方法在处理正定矩阵时计算非常复杂;对于存在先验结构的总体协方差矩阵,正则化方法和收缩方法都可能会改变原有矩阵的结构;引入某种模型来描述变量的关系则因为假设性太强而存在应用上的局限性。本文在Tong和Wang(2007)的基础上,系统地研究了一种新的估计总体协方差矩阵的方法—几何型收缩估计。该方法可以将banding方法,tapering方法,thresholding方法和算术型收缩估计统一到一种统一的框架进行研究。同时,得到的最终估计矩阵具有计算简单,保持正定性,保持先验结构等良好性质。本文研究高维总体协方差矩阵的几何型收缩估计及其在判别分析和资产投资组合中的应用。具体研究内容如下。第一章阐述本文的研究背景,综述高维协方差矩阵估计的研究历史和现状,并给出本文的研究内容。第二章给出本文所需的一些基础知识。涵盖以下三个方面的内容:首先是对几何平均值和算术平均值进行概述;其次是给出两个矩阵同时对角化的条件;最后介绍Hadamard积的符号表示及其性质。第三章研究对角型总体协方差矩阵∑ = diag(al1,…,σpp)的几何型收缩估计。首先,在最小化Log-Euclidean平方损失函数下得到最优收缩参数。其次,研究两种具体的目标矩阵下几何型收缩估计量和最优收缩参数的极限性质。其三,通过模拟验证几何型收缩估计的优良性。最后,通过传染病的数据进行实证分析。第四章研究一般正定的总体协方差矩阵∑=(σij)p×p 的几何型收缩估计。当p>n时,由于样本协方差矩阵S不再是正定矩阵。我们对样本协方差矩阵施加一个扰动使之成为正定矩阵,然后构造出对应的几何型收缩估计,并在最小化Log-Euclidean平方损失函数下算出最优收缩参数。最后通过模拟来验证估计矩阵的优良性。第五章研究具有某些给定结构的正定的总体协方差矩阵∑ =(σij)p×p的几何型收缩估计。首先,在Hadamard积框架下提出带结构的协方差矩阵的几何型收缩估计量。其次,给出常见的目标矩阵。然后,在最小化Log-Euclidean平方损失函数下推导出最优收缩参数。最后通过模拟来验证估计矩阵的优良性。第六章研究对角型协方差矩阵的几何型收缩估计量在对角判别分析中的应用。首先介绍对角判别分析(DLDA)和二次判别分析(DQDA)的理论,然后将对角型总体协方差矩阵的几何型收缩估计量应用到对角判别分析(DLDA)和二次判别分析(DQDA)中,得到几何收缩对角判别分析方法(GDLDA)和几何收缩二次判别分析方法(GDQDA)。其次通过模拟分析,比较各种判别分析方法的优劣。最后应用colon基因数据验证各个判别分析方法的误判率。模拟和实证的结果表明,GDLDA和GDQDA在绝大部分情况下误判率最低。第七章研究一般正定的总体协方差矩阵的几何型收缩估计量在投资组合中的应用。首先对最小方差投资组合(GMVP)理论部分进行介绍,并利用一般正定的总体协方差矩阵的几何型收缩估计量得到投资组合的最优权重的解析解。其次,利用CSMAR下载的2015-2016年上证A股的数据,计算由算术收缩估计,几何收缩估计和样本协方差得到的投资组合的最优权重。将等权组合的收益作为基准值,比较各个投资组合的期望收益与基准值之间的差异。实证结果表明,几何型收缩估计在投资组合中更为有效。第八章为全文的主要结论和展望。归纳本文的主要工作和主要结论,并对未来研究进行展望。
其他文献
石油,是一种成分复杂的混合物,是现今日常生活中不可缺少的战略能源,素有“工业之血”及“黑金”之称。在相关石油工业如钻探、开采、炼制及运输等过程中,操作不当或突发事故
随着工程建设事业不断发展,建筑数量与规模有了显著提升,人们对建筑功能、造型等提出了许多新的要求。现阶段,许多设计师过度追求最新设计潮流,对建筑自身的创新性及可拓思维
目的:后牙锁合是口腔临床错合畸形的常见问题之一,其矫治具有一定的难度,临床医生应根据临床病例口颌面部实际的个性化表现,来选择不同的后牙锁合治疗方法。这项研究的目的,旨在于评估一种新型悬臂式矫治器,其在临床上应用于后牙锁合的治疗的临床效果。方法:这项回顾性研究选取了2009年至2017年于重庆医科大学附属第二医院口腔科就诊的14例有后牙锁合表征的患者,在这些后牙锁合病例的正畸治疗中,这种新型悬臂式矫
知识经济时代,服务营销成为我国市场营销的主流,随着互联网的迅速发展,服务营销面临着剧烈的变化。分析了“互联网+”背景下《服务营销》教学改革的必要性和教学中存在的问题,并在
随着纳米技术研究不断发展,纳米材料基于其独特的物理化学性能,对能源高效存储、生物化学信号精确检测等产生了极大的推动力。在电化学储能领域,纳米材料具有大的表面积、相
目的:克隆核心组蛋白H2A、H2B、H3和H4的基因,表达并纯化组蛋白与谷胱甘肽S-转移酶(GST)的融合蛋白。方法:用PCR方法从乳腺文库中扩增核心组蛋白H2A、H2B、H3和H4的编码序列,
浅海海底混响一直以来都是水声研究中的热点问题,但是以往的研究多基于经验散射模型,这不利于混响物理机制以及复杂双基地三维混响问题的研究。本文根据混响的成因首先研究了
不断发展的交通系统对自然生态环境造成了很大的影响,交通问题已经成为一个急需解决的复合生态系统问题。文章从理论层面总结了生态交通的基本特征,综述了交通建设对生态系统
【目的】探讨云贵高原地区土壤有机碳含量及其活性组分在退耕还林后的变化,为退耕还林后的土壤碳储量变化评价和碳汇管理提供科学依据。【方法】在云南省宣威市选择耕地对照
目的观察预防性护理对大量输血患者输血不良反应发生率的影响。方法选取2016年1月~2017年8月我院大量输血患者76例作为研究对象,将其随机分为对照组与观察组,各38例,分别给予