复杂数据的统计分析与建模

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：ttmm

【摘要】

：

在统计研究中,复杂数据的分析与建模得到了广泛关注.本文所考虑的复杂数据包括纵向数据、缺失数据和测量误差数据.纵向数据分析的关键在于建模时如何考虑个体内部不同测量之

【作者】

：

刘娟芳

【出处】

：

北京工业大学

【发表日期】

：

2017年01期

【关键词】

：

纵向数据逆概率加权广义估计方程二次推断函数广义经验似然变量选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在统计研究中,复杂数据的分析与建模得到了广泛关注.本文所考虑的复杂数据包括纵向数据、缺失数据和测量误差数据.纵向数据分析的关键在于建模时如何考虑个体内部不同测量之间的相关性,广义估计方程常常用来作为分析纵向数据的工具.纵向数据受各种主客观原因常常会出现缺失的情形,当缺失观测的概率依赖于观测数据时,估计方程通常是有偏的且得到的估计不相合.逆概率加权的思想是通过对观测到数据的加权调整,进而可以得到参数的相合估计.在实践中,一些协变量可能会因为变量本身的性质或测量机制而含有测量误差,对测量误差数据进行统计分析也很有必要.具体地,本文的研究内容有以下四个方面.对响应变量单调缺失下的纵向线性模型,基于二次推断函数和逆概率加权广义估计方程提出了回归系数的估计方法.该方法有效处理了纵向数据的组内相关性,并且不需要估计工作相关矩阵中的讨厌参数.在一定的正则条件下,证明了所得估计量的相合性和渐近正态性.通过模拟研究和实例分析验证了所提出方法在有限样本下的实际表现.对协变量含有测量误差的纵向部分线性模型,基于偏差校正和二次推断函数提出了一种广义经验似然的方法来估计模型中的参数分量和非参数分量.给出了回归参数的广义经验对数似然比统计量和非参数分量的残差调整的经验对数似然比统计量,证明了给出的经验对数似然比依分布收敛于卡方分布,并构造了相应的置信域.与基于正态逼近方法构造置信域相比较,经验似然方法构造置信域不需要估计渐近方差和偏差.模拟研究也显示所提方法具有更好的有限样本性质.对响应变量缺失协变量有测量误差下的纵向部分线性模型,假定基于测量误差数据的缺失机制,缺失机制的调整更加合理并且对模型参数也有更明确的解释.该方法建立了 Logistic缺失机制模型,考虑了纵向数据的组内相关性及其对测量误差的纠偏项的影响,给出了回归参数的广义经验似然比,并证明了该统计量是渐近服从中心卡方分布.对非参数分量,利用借补的方法提出了借补的经验对数似然比统计量,证明渐近服从非中心卡方分布.为此,给出了残差校正的借补的经验对数似然比,这样避免了欠光滑而且偏差项也消失了.同时分别构造了兴趣参数和非参数分量的置信域和逐点置信区间.经验似然方法构造置信域不需要渐近方差和渐近偏差的相合估计,往往精度更高.模拟和实例分析结果可以看到这一点.对纵向单调缺失数据下的部分线性模型,提出了光滑阈的变量选择方法.该方法是基于逆概率加权广义估计方程提出的,因此称之为光滑阈逆概率加权广义估计方程方法.所提出的方法可以自动地将不显著变量的系数压缩为零,同时通过光滑阈逆概率加权广义估计方程给出重要变量系数的估计值.该方法有光滑阈估计方程方法的优点,即它避免了惩罚函数的凸优化问题而便于计算.在一定的正则条件下,证明了变量选择的相合性和估计的Oracle性质.模拟研究结果表明所提出的变量选择方法是有效的.

其他文献

润燥止痒胶囊联合左西替利嗪治疗老年糖尿病性皮肤瘙痒症36例

老年糖尿病患者常伴皮肤瘙痒,其发病率为7%～43%,以寒冷季节多见,且夜间瘙痒尤甚,严重影响生活质量。目前西医治疗该病主要依靠抗组胺药物对抗瘙痒症状,起效较快,但仅是对症处

期刊

润燥止痒胆囊左西替利嗪老年糖尿病皮肤瘙痒

论政治和谐视阈下九三学社核心价值观的构建

核心价值观是现代政党的立党之本,核心价值观是保持九三学社参政党特点和优势的根本,是开发九三学社参政党功能的关键,但非竞争性政党制度的内生缺陷,九三学社自身发展的不足

期刊

政治和谐参政党建设九三学社核心价值观

流道形式对固体氧化物电解池共电解性能的影响机制研究

能源是人类生存的重要资源,随着社会的发展传统能源面临一系列问题,能源枯竭,环境污染,温室气体CO_2过量排放,全球变暖。新能源如风能、太阳能的发展有望缓解传统能源的问题,但高弃光率、弃风率、电能无法并网、浪费等问题严重制约着新能源的发展。固体氧化物电解池(SOEC)是近年来学者较为关注的新型电解池,采用SOEC将H_2O和CO_2进行共电解制备H_2和CO有望成为捕集、利用CO_2,有效利用新能源

学位

固体氧化物电解池共电解分布特性操作条件流道形式

浅谈陕北说书的语言特征

陕北说书是在陕西省北部等地区较为流行的表演形式。在最初的表演中,主要是由穷苦盲人,通过陕北小调等形式对一些传说故事进行演唱,经过不断的发展,对陕北地区一些特有的表演

期刊

陕北说书语言特征地方文化民俗习性

水下自密实混凝土力学性能的研究

通过室外水槽模拟试验,研究自密实混凝土在水下的流动及填充能力,并与陆地成型混凝土进行对比,采用钻芯法及回弹超声波法进行测试,并通过数理统计进行分析.试验结果表明:水下

期刊

自密实混凝土流动能力填充能力结构设计

肿瘤化疗止吐药物的合理应用

肿瘤化疗药物在使用过程中最常见不良反应是恶心、呕吐,这就是通常说的化疗引起的恶心呕吐(Chemotherapyinduced nausea and vomiting,CINV)。这一不良反应使得肿瘤患者的依

期刊

肿瘤化疗止吐药物合理应用

几种新型的掺铒光纤放大器

概述了近年来掺铒光纤放大器(EDFA)的技术发展 ,着重介绍了单泵两级EDFA、远泵浦EDFA、增益均衡或增益锁定EDFA三种新颖的原理结构,为未来实用的优化EDFA提供一些参考.

期刊

掺铒光纤放大器增益均衡波分复用

专利制度的成本收益分析

专利的经济效益问题一直是宏观专利管理工作面临的一项重要课题。专利法作为一项法律制度，目的是促进发明创造成果经济效率的提高。经济学的成本收益分析方法为探求提高发明成

期刊

专利制度专利期限成本收益寻租

高通量鉴定病原菌表面蛋白与宿主细胞表面分子之间的相互作用

病原菌与宿主蛋白质之间的相互作用参与着病原菌所有的感染过程。研究病原菌与宿主之间的相互作用能够我们全面理解细菌病的致病机理。尽管目前这个领域已有少量的研究,但仍

会议

全要素生产率视角下东北三省经济增长问题研究

东北地区经济增长问题是当前学界讨论的热点。从全要素生产率视角分析发现,近年来东北三省全要素生产率不断下降,经济增长更多是依靠加大投资实现的。因此,推进经济转型、提

期刊

东北三省经济增长全要素生产率

复杂数据的统计分析与建模

其他学术论文