大规模数据下基于充分降维的Leverage重要性抽样方法

来源 :统计研究 | 被引量 : 0次 | 上传用户:slow1223rabbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度。对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法。本文发现,该方法中度量样本重要性的Leverage分数与因变量无关,而且在维度较大的情形下对样本没有区分程度,使得估计结果较差。为了同时考虑因变量和维度的影响,本文提出了基于充分降维的Leverage重要性抽样方法。该方法以不损失信息为前提,在充分降维的空间内重新计算Leverage分数,使得抽样更具有代表性
其他文献
中国民营经济的高质量发展任重道远,新的创新驱动路径亟需拓展。互联网与实体经济的深度融合使得互联网的"资本化"趋势愈发凸显,而互联网资本对民营企业创新的作用机理研究尚
真正面向现实的马克思主义哲学研究必须有明确的“提问方式”。当代中国的马克思主义哲学研究应当首先确立“中国提问方式”,以此来逐步形成明确的研究范式和科学合理的问题意
摘要: 目的:分析丙种球蛋白与甲基强的松龙联合治疗早期重症手足口病的治疗效果。方法:从2011年2月到2014年5月与我院治疗的早期重症手足口病患者中选取76例病例,分成在常规利巴韦林静脉滴注及抗生素等治疗中加入丙种球蛋白单药治疗的对照组(38例)与在常规疗法中加入丙种球蛋白静滴与甲基强的松龙联合治疗的观察组(38例),观察各组疗效、并发症及热退、抖动易惊消失、白细胞恢复等所需时间,分析丙种球蛋白