缺失数据情形非参数回归函数的估计

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:XXLXSJXXLXSJ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际问题中,由于某些抽样个体不愿意提供所需信息、某些不可控的原因导致信息丢失以及调查者未能收集到准确信息等因素而导致大量缺失数据的产生. 事实上,数据缺失在可靠性寿命试验、市场调查、医学研究以及科学试验等中经常发生. 近年来,缺失数据情形的统计推断已成为当今统计界的一个热门研究领域。在有数据缺失的情况下通常的统计方法往往不能直接应用,需要对数据进行必要的处理. 最早用于处理缺失数据的方法是Complete-Case 方法,它是将所有数据缺失的项删除,然后对余下的项构成的“完全样本”按照通常的统计方法进行统计推断。现在处理不完全样本的常用方法是填补法,分为固定填补法和随机填补法两种,它们都是对缺失值进行必要的补充,继而得到“完全样本”,再按照通常的用于完全样本情形的统计方法进行统计推断。 非参数回归模型是一种重要的统计模型,该模型广泛用于解决经济和医学等领域的诸多问题。在完全样本情形,Benedetti 讨论了Priestley-Chao 型固定设计权函数估计的强相合性,Georgiev and Greblicki系统研究了固定设计情形一般权函数估计的均方相合性和完全收敛性;孙东初(回归函数核估计的强相合性[J],数学年刊,1985,6A(4):481-486.),方兆本和赵林城(非参数回归核估计的强相合性[J],应用数学学报,1985,8(3):268-276.),Schuster等在随机设计情形研究了非参数回归模型核估计的大样本性质。 在缺失数据情形,响应变量满足MAR 缺失机制下,Cheng基于核回归补足得到的“完全样本”讨论了随机设计情形非参数回归模型中响应变量均值的渐近正态性,Wang andRao基于核回归补足得到的“完全样本”构造了随机设计情形非参数回归模型响应变量均值的经验似然置信区间,Wang and Rao基于固定补足得到的“完全样本”研究了固定设计情形线性模型回归系数的经验似然置信域的构造。 第二章考虑固定设计下的非参数回归模型,在响应变量有缺失的不完全数据情形,用三种不同的处理方法处理缺失数据,即利用剔除有缺失数据的个体资料方法,利用确定性补足得到的“完全样本”和随机补足得到的“完全样本”,由此给出了回归函数的三种估计,并讨论了估计的强、弱相合性和渐近正态性。 第三章考虑了随机设计下的非参数回归模型,在响应变量有缺失的不完全数据情形,用两种不同的处理方法处理缺失数据,即利用剔除有缺失数据的个体资料方法和回归补足得到的“完全样本”,由此给出了回归函数的两种估计,并讨论了估计的强、弱相合性和渐近正态性。 本文的特色体现在以下几个方面: 1. 在MAR 缺失机制下,首次研究了固定设计情形非参数回归模型回归函数的估计问题,对缺失的响应变量,利用三种不同的缺失数据处理方法给出了回归函数的三种估计,证明了估计的强、弱相合性和渐近正态性。 2. 在MAR 缺失机制下,首次研究了随机设计情形非参数回归模型回归函数的估计问题,对缺失的响应变量,利用两种不同的缺失数据处理方法给出了回归函数的两种估计,证明了估计的强、弱相合性和渐近正态性。
其他文献
资产定价问题一直都是金融研究领域中的热点和难点问题之一,特别是商品定价的研究,有时还会涉及到地域等时空因素的作用。经典的代理商品定价问题通常研究的是具有固定消费地点的情形,然而现实世界中,不确定性是普遍存在的,因此本文拟考量消费地点不固定情形下的代理商品定价问题。本文研究消费者随机型最优消费问题和代理商随机型最优定价问题。首先,研究消费者随机型最优消费问题,即研究使得消费者总支出最小的消费策略,运
学位
中国是一个滑坡地质灾害发生十分频繁和灾害损失极为严重的国家,据初步统计,我国每年因滑坡、崩塌等斜坡变形破坏造成的损失高达30~50亿美元。目前,在我国不可能有足够的经济和技术力量对有潜在危险性的滑坡灾害点进行全面治理的情况下,如果能够及时准确地预报滑坡的滑动时间,就可以尽早采取减灾防灾措施和对策,使这类灾害造成的损失减少到最低程度。 基于上述目的,本论文针对现代滑坡预报中存在着不能很好地剔除
在机器学习和数据挖掘领域中普遍存在着类别分布不平衡的数据集,当用传统的机器学习方法进行分类时,对多数类有较高的识别率,而对少数类的识别率很低。若少数类样本足够重要,往往
本文主要研究含有超线性项和奇异项的椭圆型偏微分方程正解的存在性.  首先,讨论了R2中一类不含Amborosetti-Rabinowitz(简称AR)增长条件的超线性非齐次椭圆方程-△u+V(x)u=