论文部分内容阅读
寿命数据存在于很多行业中,对寿命数据分析时通常会发现其与很多因素有关,如动物的寿命会受到体内的胆固醇含量、血压等因素的影响,因此探讨生存时间(因变量)和这些因素(协变量)之间的关系是一个非常有意义的课题.为了研究影响寿命长短的因素,很多学者利用经典的线性回归模型或者非线性回归模型进行分析,然而在处理一些更复杂的数据时,单纯的线性或非线性回归很难解释因变量的所有信息,由于半参数兼顾了参数模型和非参数模型的优点,其具有更强的适应性和解释能力。另外,处理寿命数据的分布种类很多,但绝大部分只能处理危险函数为单调的情形。针对危险函数不单调或者浴盆状的情况,学者提出了广义幂威布尔分布。为此,本文利用半参数回归的思想研究了广义幂威布尔分布模型。
由于大多数寿命分布模型都比较复杂,因此相关统计分析多数是基于经典的方法,很少有学者从Bayes角度出发对寿命分布进行统计分析,对半参数回归模型的Bayes统计分析的研究更是少之又少.本文研究的模型是生存分析中一个较新的模型-广义幂威布尔分布,基于此分布,文章从Bayes的角度详细讨论了模型的统计分析问题。
文章首先给出半参数广义幂威布尔回归模型,使用P-样条函数构造出惩罚似然函数,并基于经典的统计分析方法得到了参数和非参数部分的估计。接着,根据对模型中参数的了解给出其先验信息,进而得到半参数广义幂威布尔回归模型中参数的联合后验分布和每个参数的边际密度函数,在此基础上,利用MCMC中流行的Gibbs抽样方法并结合Metropolis-Hastings算法得到模型中参数的随机样本序列,从而基于此进行一系列的统计推断。其次,文章根据Kullback-Leibuler距离对模型进行了Bayes全局影响分析,得到了半参数广义幂威布尔回归模型的Kullback-Leibuler距离和近似Kullback-Lefbuler距离,同时还给出了经典方法下的广义Cook距离,似然距离,WK统计量等诊断统计量。本文还基于半参数广义幂威布尔回归模型给出了鞅残差和修正偏差度残差。最后,本文通过一系列随机模拟的方法说明了文中建议的方法以及所得的诊断统计量是有效的。