论文部分内容阅读
在重复测量数据和纵向数据的分析和研究中,混合效应模型是建立响应变量和协变量关系的一种强有力的统计工具。再生散度族是一类非常广的分布族。正态分布、Poisson分布、双指数分布、极值分布和指数族分布都是这类分布的特例。在再生散度模型的框架下将潜在的随机效应加入线性预测中就构成再生散度混合效应模型。因为这类模型是统计分析中一类很广的模型,所以它们是当前统计研究的热点之一。
首先,再生散度混合效应模型中随机效应的正态(对称性)假设是一个常规的假设,但是这个假设条件忽略(模糊)了个体间变化和个体内变化的特征,所以它可能不太现实或/且限制性太强。因此在本文中我们放松了这个假设条件,假设随机效应服从偏正态分布。偏正态分布的重要特点之一就是正态分布是它的特例,同时它还具有提供非正态行为弹性的能力。本文基于MCECM算法得到了再生散度偏正态混合效应模型未知参数的极大似然估计。此外,采用bridge抽样的方法来监控上述MCECM算法的收敛性并根据Louis缺损信息原理来估计极大似然估计的标准差。在此基础上进一步给出了一种计算简便的模型选择标准-ICQ准则。
其次,在Zhu and Lee的启示下,本文针对再生散度偏正态混合效应模型建立起一套局部影响分析方法来评价模型对于微小扰动的敏感性。具体来说,本文介绍了6种不同的扰动模型以及相应的算法。在计算过程中,本文采用了Gibbs抽样和Metropolis-Hastings算法的混合算法来从不可观测变量的条件分布中产生随机观测,并基于这些随机观测来计算诊断统计量中的基本分块矩阵,最终诊断统计量是通过保形法正则曲率获得的。此外,本文还利用Q函数而非传统的Cook的观测数据对数似然函数建立数据删除模型诊断统计量。换言之,本文发展了再生散度偏正态混合效应模型的数据删除模型诊断方法,此方法能有效识别该模型的影响点。
最后,在非线性再生散度混合效应模型的发展过程中,总是假设随机效应服从某一特定的参数族(例如正态族)。一方面,特定的参数族会限制统计推断的范围和类型;另一方面,特定的参数假设在实际应用中不一定为真。因此,本文用Dirichlet过程先验来建立随机效应的分布,从而放松了上述限制。我们对非线性再生散度混合效应模型提出一种半参数贝叶斯方法,结合stick-breaking先验、分组Gibbs抽样和Metropolis-Hastings算法从后验分布中产生随机观测,从而得到模型未知参数和随机效应的联合贝叶斯估计。在此基础上,定义了两种评价模型拟合好坏的拟合优度统计量-后验预测p值和偏后验预测p值。此外,本文也给出了进行模型比较的贝叶斯因子、伪贝叶斯因子和偏差信息准则(DIC)的具体算法。
综上所述,本文在再生散度混合效应模型的背景下得到了一系列新的成果,其推广和发展了已有的研究工作。这些新的成果不仅在理论上是重要的,而且同样具有实际应用价值。模拟研究和实例分析说明了上述新方法的有效性。