高维数据中的光滑广义经验似然和椭球切片逆回归方法

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:InsideADONET
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的十几年中,随着科技的进步,尤其是计算机技术的迅速发展,数据的收集、存储和计算能力得到了极大提升,高维数据在现实生活中已经随处可见。分析高维数据的需求源于各类现实问题,诸如经济学中的面板研究、气候变化等社会自然现象、基因分析以及通讯工程等。随着收集和存储数据能力的不断增长,工业、商业及政府部门都面临分析高维数据的任务——希望能够理解不同因素之间的联系,并合理利用相关信息提高预测精度以及降低决策风险。数据维数的大幅提升给传统的统计学与计量经济学模型带来了前所未有的挑战——已有的估计方法和检验方法大多不再适用。如何从众多信息中提取有用信息进行建模,从而制定相应的决策,已成为当前各行各业迫切需要解决的一个问题。简单来说,该领域的研究主要集中在以下两个方向:(1)高维模型的估计、推断与假设检验,(2)高维数据降维。本研究在上述两个方向上均做了一些工作。(1)由于广义估计方程模型能够有效地概括数据信息且对数据的分布要求较弱,所以在对高维数据进行建模和推断时该模型显得更具优势。本文提出了一种基于光滑矩函数(Smith,1997,2001;Anatolyev,2005)的惩罚广义经验似然方法,用于高维弱相关时间序列中的变量选择和参数估计。参数和矩条件的维数都被允许随着样本量以适当速率发散到无穷。然后,通过适当地控制数据相关程度,获得光滑广义经验似然和光滑惩罚广义经验似然估计量的渐近性质。结果表明,尽管数据之间存在依赖性且数据维数随样本量发散,光滑惩罚广义经验似然估计量仍然保持了oracle特性。仿真结果和实际数据分析进一步说明了该方法的有限样本性能和适用性。所提方法丰富了估计方程模型的工具箱,是传统经验似然方法在高维时间序列领域的一种重要拓展,是在该领域进行参数推断、假设检验和预测的基础。(2)数据降维是传统多元统计分析里一种常用的思想——运用多维观测中各分量间的相关性把数据信息尽可能地压缩到少数几个维度上,从而便于进行后续分析。该想法在高维数据分析中的意义更为重大。本研究考虑一类有监督的降维方法–充分降维。由于其简单性、通用性和计算高效性,切片逆回归(Sliced Inverse Regression,SIR)是使用最广泛的充分降维方法之一。然而,当协变量的分布偏离多元正态分布时,SIR的估计效率趋于降低。本文提出了一种SIR的稳健替代方案,称为椭球切片逆回归,用于对高维椭球分布数据进行充分降维。椭球分布数据有广泛的应用,特别是在重尾分布数据频繁出现的金融和经济学中。为了解决服从椭球分布的重尾协变量给SIR的估计带来的效率损失问题,本文在广义特征向量框架中首先利用多元Kendall’tau矩阵来进行充分降维。在方法论上,本文论证了所提方法用于充分降维的合理性并给出了一种简单实用的算法。从理论上讲,当参数维数随样本量发散时,本文研究了椭球切片逆回归估计量的大样本性质。大量模拟结果表明,相比SIR,椭球切片逆回归显著提高了重尾分布协变量下对中心子空间(Cook,1994,1998)进行估计的效率。对两个真实数据集的分析进一步表明了所提方法的有效性。此外,椭球切片逆回归的思想可以很容易地扩展到大多数充分降维方法,并在非椭球重尾分布中表现良好。本文所提方法是对现有充分降维方法的一种重要改进和补充,对重尾数据的可视化和非参数回归分析等具有重要意义。综上所述,本文考虑了如何运用光滑广义经验似然方法在高维时间序列中对估计方程中的未知参数进行估计,以及如何运用椭球切片逆回归方法对非高斯分布数据进行充分降维。由于本文考虑的非参模型框架可以用于处理众多实际问题,所以该论文充分反映了统计学解决实际问题、服务社会的特点,有着重要的理论研究和实际应用价值。本论文的特色与创新主要体现在以下两个方面:(1)方法上,本文的贡献主要体现在两个方面。第一,基于估计方程模型,本文针对高维弱相关时间序列提出了光滑惩罚广义经验似然方法。该方法在数值模拟和实际数据中表现良好。第二,针对非高斯分布数据,本文提出一种稳健的充分降维方法——椭球切片逆回归方法。该方法算法简单实用,可对大量常见的重尾数据实现充分降维。此外,该方法具有很好的扩展性。(2)理论上,本文首先推导了估计方程模型中,当参数维数和估计方程个数都随样本量发散时,光滑广义经验似然估计量的一致性、收敛速度和渐近正态性,以及稀疏假定下光滑惩罚广义经验似然估计量的神谕(oracle)性质;其次,本文对椭球切片逆回归方法用于充分降维的合理性给出了理论证明,并在发散(高)维背景下给出了该方法对中心子空间进行估计的一致性和收敛速度。
其他文献
本文研究了电力市场中摆动期权的定价问题.摆动期权是一种奇异期权,该种期权的持有者有权利在期权到期日之前重复地以某一约定价格买入或卖出某一份额的标的资产,持有者每次行权所选择的交易份额需要在在事先约定好的份额区间内变动.摆动期权的这种灵活性能够让期权持有者规避标的资产因未来价格波动和份额波动产生的风险.在非政府管制下的市场中,能源作为一种特殊的标的资产有价格易波动和不易储存的特点,因此摆动期权在现实
学位
党的十八大以来,我国社会治理精细化的推进正在深刻地影响着社会各个领域的治理实践形态。城市社区既是城市社会的细胞,也是社会治理精细化实践的重心和“最后一公里”,更是满足人民美好生活需要的“前沿阵地”。社会治理精细化在城市基层社区中的广泛推进使得我国城市社区治理系统各个层面都日益获得了“精细化”的特征。作为我国城市社区治理系统的重要组成部分和以提升居民思想道德素质、规范居民价值秩序、丰富居民精神文化生
学位
为了解决委托人和代理人之间的利益冲突和信息不对称问题,设计有效的激励合约是很重要的。使用指数―线性结构的连续时间委托代理模型,Holmstrom和Milgrom(1987)得到了线性最优合约。基于Holmstrom和Milgrom(1987)的模型,很多学者研究了更复杂模型下的最优合约问题。在常数边际生产率和常数波动率的情形下,Williams(2015)研究了完全信息、隐藏行为和隐藏储蓄三种信息
学位
经典的期权定价理论建立在无摩擦的、完全的市场框架下,定价的焦点通常是唯一的风险中性价格或者均衡价格。然而,经典框架下的BlackScholes-Merton模型及其后续修正模型都忽略了市场流动性的影响。即使在高度竞争的市场状况下,人们也确切地观察到了流动性下降,尤其是在金融危机时期流动性不足引起了市场参与者的严重担忧。在考虑了Knight不确定性的真实市场中,当非流动性导致巨大的买卖价差时唯一的风
学位
现行的军队人事管理制度,更多体现了军官职业的义务性,强调军官在一段有限的服役时间内具备奉献与服从意识,并不十分关注军官职业生涯的整体构建,缺乏树立帮助个人成才和获得成就感的理念。随着时代的发展,军官走向职业化是军队对人才需求升级、社会生产力和军事技术发展到一定程度后所产生的必然趋势。因此,在军队这种特殊的组织背景下,本文的研究视角将从如何吸引优秀人才成为军官、如何令青年军官不断提升自身素质并长期为
学位
食品安全责任强制保险“试点”的开展,揭开了我国运用强制保险手段加强食品安全治理的帷幕。它为我国深入推进政府职能转变和加强受害人保护提供了重要抓手和有效路径。然而,由于食品安全责任强制保险是对契约自由的重大限制,再加上缺乏成功的经验可资借鉴,社会对其应否推行以及如何推行的论争不断。反映到立法上,《食品安全法》的修订也经历了在“鼓励投保”和“强制投保”之间的艰难选择。虽然出于谨慎的考虑,食品安全责任强
学位
经济转型时期的总量失业一直备受关注,但经济转型进程中的结构性失业并没有销声匿迹,而是时有显现,并且逐渐步入加速凸显的通道。当前中国特色社会主义迈入新时代,经济发展由高速增长阶段转向高质量发展阶段。经济高质量发展的核心要义在于满足人民日益增长的美好生活需要,解决发展过程中的不平衡、不充分的难题,也是落实新发展理念,实现人的全面自由发展的需要。就业是最大的民生问题,中国特色社会主义新时代背景下,解决社
学位
人口老龄化背景下,我国数量型“人口红利”的逐渐消失使得劳动密集型优势减弱、传统要素对于经济增长的驱动力下降。然而,人口结构变化中劳动力质量提高与高素质劳动力占总人口比重上升,以及科技、制度等创新改革举措,将形成质量型的人力资本红利。人力资本红利的形成和扩大,将成为缓解人口数量红利消失对我国经济的不利影响,助力中国经济实现中高速增长、迈向中高端水平的关键。既往中国人力资本对经济增长效应的研究多借助于
学位
用什么样的经济学理论指导中国特色社会主义的经济实践,是直接影响中国特色社会主义发展的关键课题。习近平同志在主持中共中央政治局第二十八次集体学习时,首提“发展当代中国马克思主义政治经济学”,是为这一关键课题作出了的当代注脚。如何发展当代中国马克思主义政治经济学?当代中国马克思主义政治经济学的出发点问题是回避不了的问题。所谓“回避不了”,一方面,是由于万事万物都有出发点,出发点问题作为一门科学的开端问
学位
服务业已成为我国第一大产业,在经济增长中扮演着越来越重要的角色。作为供给侧改革的主动力,服务业的市场活力正全面释放,服务企业竞争更加激烈。当前,随着争夺顾客、提升品质成为竞争成败的关键,服务企业对员工提出了越来越高的工作要求,这势必增加员工的工作压力。工作压力是企业发展过程中一项非常重要的推动力,但它一直以“双刃剑”的面目出现,在正常阈值内,它能促使员工更加努力地工作;然而超过阈值,则过犹不及,员
学位