【摘 要】
:
高维数据分析与建模是目前统计领域研究的热点之一,而方差估计则是统计建模中的一个基本问题。在维度远大于样本大小的高维线性回归中,由于设计矩阵的逆矩阵不存在,无法得到参数估计量,导致传统的方差估计方法通常并不适用。因此在高维数据研究中通常会先进行变量选择,使得变量个数小于样本量,以达到降维的目的,从而再进行参数估计和统计推断的工作。值得注意的是,在高维数据中噪声和一些预测变量之间存在着高度伪相关性,因
论文部分内容阅读
高维数据分析与建模是目前统计领域研究的热点之一,而方差估计则是统计建模中的一个基本问题。在维度远大于样本大小的高维线性回归中,由于设计矩阵的逆矩阵不存在,无法得到参数估计量,导致传统的方差估计方法通常并不适用。因此在高维数据研究中通常会先进行变量选择,使得变量个数小于样本量,以达到降维的目的,从而再进行参数估计和统计推断的工作。值得注意的是,在高维数据中噪声和一些预测变量之间存在着高度伪相关性,因此在首轮的变量选择过程中伪相关变量会被误选为重要变量,这将导致对噪声的严重低估。本文将基于高维单指标模型研究如何减轻高度伪相关变量对变量选择的影响及对其方差估计的影响。单指标模型是广义回归模型中一种特殊的半参数模型,该模型的特点就是既可以降低变量的维度,同时又能抓住高维度数据的稀疏性,有效地避免了“维度诅咒”问题。本文主要针对高维数据下的单指标模型,提出使用重拟合交叉验证(Refitted Cross-Validation)方法对其进行方差估计。该方法有效地减轻了高度伪相关系数对方差估计的影响。在数值模拟部分,本文分别以二次函数和指数函数两个高维单指标模型为例,使用sim-Lasso和SIRS两种变量选择方法并结合重拟合交叉验证方法估计方差,并与Oracle方法和简单两阶段方法进行比较。结果表明,使用重拟合交叉验证方法结合两种不同类型的变量选择方法对单指标模型进行方差估计的表现更接近Oracle估计量,其误差和方差均低于简单两阶段法的结果,并且随着维度增高估计量依旧稳健,充分降低了高维数据下伪相关问题对方差估计的影响。最后,通过实际数据验证了方法的有效性。
其他文献
经济社会的快速发展衍生出大量的现代新型诉讼案件,由于这类案件本身法律关系的特殊性以及案件当事人在现实社会中经济能力、社会地位存在较大差距,导致关键性证据经常处于一方当事人控制下,另一方当事人几乎无获得所需证据的可能性,即证据偏在现象。为实现民事诉讼武器平等原则、证据协力之理念,塑造当事人平等对抗的格局,必须充分保障弱势一方的证据收集权。在协同主义诉讼模式备受瞩目背景下,文书提出义务制度作为解决证据
在我国市场经济不断发展的大背景下,委托他人处理事务的情形越来越常见,市场经济活动中的背信行为也变得越来越突出,这类行为对诚信这一市场经济赖以生存的基本原则造成了严重的破坏。然而,我国现行刑法却一直没有规定背信罪,并且现在存有的特殊背信犯罪也在构成要件中存在一定的限制,导致一些足以造成严重后果的新类型的背信行为不能得到有效规制,给我国当前市场经济的健康发展带来了巨大的阻碍。因此设立背信罪将会成为有效
我国民事诉讼法奉行“谁主张,谁举证”的举证责任,在现阶段我国司法环境下,逐步形成了适合中国国情、带有中国社会主义法治特色的证据收集制度——律师调查令制度。自1998年上海市长宁区法院创新性的推出试点,对民事诉讼证据调查令制度进行实践。调查令制度在我国已有20多年的发展历史,且在全国各级法院都针对其进行不同程度的探索和创新。虽然在现阶段,我国律师调查令制度实行过程中,出现了不少阻碍,但这并不能否认其
“中央”研究院歷史語言研究所組織的殷墟第十三次科學發掘是我國考古史上的一次重大突破,此次發掘出土了 YH127坑整坑甲骨,未經盜掘損壞,其研究意義與價值重大。1957年至1972年,張秉權選取《殷虛文字乙編》(以下簡稱“《乙編》”)中較為完整的龜版綴合而成《殷虛文字丙編》(以下簡稱“《丙編》”),推進了甲骨學各方面的研究,其影響至深至遠。然而,除此之外,張先生也對《乙編》中除綴合成《丙編》之外所餘
第三人利益合同相较于一般合同而言最为显著的特征便是使合同当事人以外的第三人取得合同权利。第三人利益合同制度的立法初衷在于保护第三人利益,所以整个第三人利益合同制度的设计均应从保护第三人利益的角度展开。围绕这一中心点进行制度设计时,应充分考虑第三人取得合同权利的法理基础及在审判实践中的具体适用问题。《民法典》的出台确实增加了第三人利益合同制度的规定,但也仅为初步规定。虽终结了理论界对该制度存在的部分
胁迫行为是侵犯他人意志决定自由的违法行为,起先在民法中加以适用,随后引入到刑事案件中,被各国刑法规定为一项罪行。我国刑法分则中明文规定了许多以胁迫方式实施的罪名,但由于只是对胁迫行为进行列举性规定,导致很多严重的犯罪行为未被包含,司法实践中还存在很多由胁迫类犯罪引起的定罪量刑标准混乱的问题。本文将胁迫行为作为研究对象,旨在从立法方面完善对胁迫行为的规制。本文共分为六个章节对胁迫行为的刑事立法进行论
智慧城建作为智慧城市的重要组成部分,其评价指标体系的构建是否完整将影响到智慧城市的建设效果。首先研究分析国内智慧城市评价指标体系的构建情况;然后基于安徽省城市发展现状,针对安徽省住建行业,构建和量化安徽省智慧城建评价指标体系,对安徽省部分省辖市进行评价计算和综合分析,结果显示,合肥市、芜湖市智慧城建评价属于三星级;最后对安徽省智慧城建评价进行总结与展望。
随着经济全球化的蓬勃发展,中国经济对外开放的程度也在不断加深。加入全球价值链,是中国对外开放的一个主要方式,企业通过从事加工贸易等生产活动以参与国际分工。近年来,中国在全球价值链中的地位也越来越重要,成为了“世界工厂”。与此同时,从绝对数值上看,中国的劳动力就业水平及劳动工资均在提高,然而,进入21世纪后,劳动力的就业增长率及劳动收入份额同时出现了下降。当前国内经济增速放缓,失业率水平不断提高,劳
二维材料自问世以来就得到了学者们的广泛关注。作为其中典型的代表,过渡金属硫族化合物因其独特的半导体特性,有望被广泛应用于光电探测器、晶体管和发光二极管等领域。其中,二硫化钨(WS2)由于其较高的开关比、独特的谷极化特性、以及较低的亚阈值摆幅,在光电器件中有广阔的应用前景。虽然理论计算预测了WS2优异的电学性能,但是WS2基电子器件依然存在较高的肖特基势垒和较低的载流子迁移率等问题。为了解决这一问题
在国家推进贸易高质量发展的背景下,本文主要研究了大学扩招带来的人力资本增长对于企业出口产品质量的影响,人力资本的增长有助于新技术的开发、对于国际前沿先进技术的学习吸收以及生产效率的提高,这都有助于产品质量的提升。借助于1999年的中国大学扩招政策作为准自然实验,利用双重差分法评估人力资本对于企业出口产品质量升级的因果效应。使用海关数据和工业企业数据,我们发现人力资本能有效促进企业产品质量的增长,2