论文部分内容阅读
在环境工程、流行病学等学科的数据分析中会遇到受侦测限影响的缺失数据,关于该数据的统计处理,现有的方法有简单借补法(Ad hoc方法)和极大似然方法,以及在对称分布下新提出的对称借补法、分布借补法等.本文将分别针对正态总体和对数正态总体,研究由受诊断限影响的缺失数据估计总体均值的问题. 第2章对正态缺失数据现有的3种有效推断方法(对称借补法,分布借补法,Co-hen极大似然法)分别提出了改进,并通过模拟研究了3种方法改进后在推断总体均值估计中的表现,模拟结果表明:改进后的3种方法所得的点估计近似无偏,三者的均方误差很接近,总体均值的置信区间的覆盖率都有了较大改善;改进后的对称借补法和Cohen极大似然法表现很接近,其覆盖率都更接近于名义的置信水平;由于在计算上改进后的对称借补法比Cohen极大似然法更为简单,因此,在缺失概率低于0.5且中位数可被观测到的情形,可首选改进后的对称借补法. 借助于对数正态变量和正态变量的关系,结合对称借补法和完整数据下现有方法,第3章提出了对数正态缺失数据的3种新的均值估计的方法:Cox-SIM方法、调整的Cox-SIM方法和大样本理论-SIM的方法.并通过模拟研究了3种新方法的统计表现.模拟结果表明:3种新方法所得到的总体均值的置信区间的覆盖概率与未缺失数据情况的相应方法下得到的覆盖概率都很接近,其覆盖概率都随着样本量的增大而增大,这表明我们提出的3种新方法所得到的置信区间不但稳健,而且具有相合性;在3种新方法中,调整的Cox-SIM方法所得到的总体均值的置信区间的覆盖概率更接近于名义置信水平,表现最好.进一步,我们模拟比较了调整的Cox-SIM方法、Ad hoc方法和极大似然估计,结果表明调整的Cox-SIM方法表现也优于现有的这2种方法.