论文部分内容阅读
在生存分析和可靠性研究中,常常因为客观条件的限制无法得到失效时间的准确观测值,只能观测到它所处的区间,在统计学中一般将这类数据称为区间截断数据(Interval censored data),简称区间数据。区间数据的存在使得许多传统的统计方法都无法直接使用,所以无论是从实际应用还是理论研究的角度来说,对区间数据的相关问题进行研究都是很有意义的。 区间数据的统计研究由来已久,目前已有大量的相关文献。在这些研究中,较为典型的一类是采用非参数极大似然(NPMLE)的思想来解决分布函数估计问题和回归模型中的问题,得到了一些较好的理论结果。但是利用极大似然方法进行区间数据的研究也存在着一些不足,求解非参数似然方程的过程非常繁琐,常常只能通过迭代计算的方法得到似然方程的近似解,实际操作难度较大。因此,本文从无偏转换(Unbiased transformation)的思想出发,对区间数据的一些相关问题进行了研究。无偏转换的主要思想是:构造出一个和被截断随机变量均值相同的统计量,然后再利用传统的统计方法进行研究。使用这种方法对区间数据的相关问题进行研究,可以得到很多传统方法所能得到的优良性质,从实际操作的角度来讲,也比NPMLE更加便捷。 文章的第一章对区间数据的定义、区间数据相关问题的一些现有研究以及无偏转换的思想进行了介绍;从第二章到第五章,本文利用无偏转换的思想,解决了区间数据的若干估计问题。第二章将Zheng(2003)对区间数据的期望进行估计的做法进行了推广,得到了区间数据任意阶原点矩和方差的估计,并证明了估计量的强相合性(收敛速度可以达到n-1/2(loglogn)1/2)和渐近正态性;第三章研究了线性回归模型中响应变量为区间数据时误差项方差的估计,文中利用无偏替代变量构造了误差项方差的一个估计类,并证明了这个估计类中所有的估计量都具有渐近无偏性、强相合性和渐近正态性;第四章研究了非参数回归模型中响应变量为区间数据时回归函数的估计,文中利用无偏替代变量来求回归函数的近邻权函数估计,并证明了所得估计的强相合性;第五章考虑了截断变量的分布密度函数g未知的情形,对区间数据的任意阶原点矩、方差、响应变量为区间数据时简单线性模型的回归系数和误差项方差,以及响应变量为区间数据时非参数回归模型的回归函数进行了估计,在比较合理的条件下得到了这些估计量的强相合性质;并且证明了可以选取适当的无偏转换,使得其中部分估计量的强相合收敛速度达到相应的一元密度函数估计的强相合收敛速度;第六章用模拟计算验证了上述结论。