论文部分内容阅读
在实际应用中,人们广泛使用线性混合模型(linear mixed models,简称LMMs)、广义线性模型(generalized linear models,简称GLMs)、广义线性混合模型(generalized linear mixed models,简称GLMMs)等工具来分析各类实际数据。特别地,其中广义线性混合模型在非寿险精算,医学,生态学,传染病学等领域中存在大量潜在应用。然而,相比其他模型而言,广义线性混合模型的估计涉及高维积分问题,因此其实际计算较为困难。在现有文献中,Breslow和Clayton(1993)[3]最早探讨了如何采用Laplace方法进行快速近似计算相关拟似然估计的问题,并提出了一类基于惩罚拟似然的计算方法(简记为PQL,Penalized Quasi-Likelihood),并推导了相关方法的理论性质。然后,近年来随着数据搜集越来越便利,海量数据逐渐出现,这给相关模型的实际应用带来极大挑战。在大数据情形下,Jordan等(2018)[18]提出了针对线性模型、广义线性等模型的通信有效推断方法。考虑到Jordan等(2018)[18]的相关方法无法直接应用于广义线性混合模型的情形,因此本文重点考虑了如何对广义线性混合模型进行分布式统计计算的问题,并编写了基于R、C++、Armadillo等工具的程序实现。类似于Jordan等(2018)[18],本文方法采用了通信有效的处理方式,将优化过程中涉及黑森矩阵的部分进行重复利用的设置,因而可有效提高相关方法的计算速度。最后,本文通过模拟验证了本文所提方法的有效性,并通过实际例子验证新的计算方法的相关性能。在此,作者期待本文有关广义线性混合模型中的通信有效分布式统计计算方法的探讨,可以为今后可能的实际应用提供帮助。