论文部分内容阅读
在诸多临床试验和医学跟踪研究中,人们所搜集到的纵向数据往往会存在缺失的情况,这将导致模型参数的估计出现较大偏差,因此必须对纵向缺失数据进行处理,以此来提高数据分析的质量。在对缺失数据处理的过程中,根据纵向数据缺失原因的不同,本文将纵向缺失数据分为间歇性缺失和退出性缺失两大类缺失数据进行讨论研究;本文假设了纵向响应变量与观测时间点具有非线性关系,对随机效应基于一种半参数方法对其先验分布建模,采用线性混合效应半参数模型对纵向过程进行建模,并结合缺失数据部分的模型,建立了一种非随机缺失机制下的纵向半参数联合模型。在贝叶斯框架下,本文对该联合模型进行了变量选择,对未知参数进行了贝叶斯估计,并进行了模型比较。在本文中,首先讨论了一种纵向半参数模型,采用半参数方法的中心化Dirichlet过程混合模型(CDPMM)建模随机效应的先验分布,这样可以有效捕获随机效应潜在的先验信息,使得参数估计更加稳健;其次,讨论了非随机缺失机制下间歇性缺失和退出性缺失这两大类缺失数据的建模方法,建立了间歇性、退出性缺失数据转移概率模型,通过共享随机效应将所建立的纵向半参数模型和间歇性、退出性缺失数据转移概率模型联系起来形成非随机缺失机制下的纵向数据半参数联合模型;然后,在贝叶斯框架下,本文结合MH算法以及Gibbs抽样对所建立的联合模型进行了贝叶斯分析,同时使用B-样条方法来拟合纵向数据的观测时间点的光滑函数,运用BLasso方法对模型中的未知参数进行了变量选择,以此来识别模型中的重要变量,并将本文建议的模型同其它竞争模型进行模型比较;最后,对所建立的非随机缺失机制下的纵向数据半参数联合模型进行模拟研究和使用ACTG-193A研究数据进行了实例分析,从而验证了本文所建议模型的可行性。