论文部分内容阅读
潜在类别模型(latent class model,LCM)是作为处理分类潜变量发展起来的一种理论体系。潜在类别模型综合了结构方程模型与对数线性模型的思想,形成了自身的优势,其目的在于以最少的潜在类别数目来解释显变量之间的关联。潜在类别模型的提出不但弥补了结构方程模型仅能处理连续潜在变量的不足,也为医学、社会科学研究者面对俯拾即是的类别数据提供了一种新思路。潜在类别模型的这些优点适应了医学模式转变所带来的病因关系的复杂性对统计分析方法的改进所提出的要求。因此,在医学多变量关系的研究中引入LCM具有重要的现实意义。本文系统阐述了潜在类别模型的原理、方法,并重点地对其分析过程,即模型参数化、参数估计、模型识别、拟合优度评价、潜在分类与结果解释等进行了概括与总结。模型参数化包括概率形式与对数线性参数形式,并对参数化中的参数进行了解释;参数估计利用迭代最大似然估计方法即EM和NR算法;模型拟合优度评价利用Pearsonχ2、似然比χ2、AIC、BIC做出综合性的判断;最后把各组观察值分类到适当的潜在类别当中并进行结果解释。潜在类别模型分为探索性与验证性两种基本类型,本文阐述了两种类型的基本原理与分析步骤,介绍了多样本潜在类别模型。本文分别进行了二分类潜在类别模型与三分类潜在类别模型分析。数据模拟使用Mplus软件Monte Carlo simulation study模块进行编程实现。首先利用Monte Carlo simulation study模块按照预先设定模型产生模拟数据,然后导入Mplus软件直接进行潜在类别分析及多样本分析比较,用图示直观地表现模型参数变化。实例分析部分对抑郁患者单核苷酸多态性SNPs(single-nucleotide polymorphisms,单核苷酸多态性)检测数据进行潜在类别分析,对7个SNPs数据进行“压缩降维”,考察SNPs的潜在分布。结果显示7个SNPs可分为两个潜在类别,各潜在类别概率分别为22.378%、77.622%,其中类别一倾向于杂合子,类别二倾向于纯合子。结合潜在类别分析发现某些心理特质与此相关,显示类别1具有消极应对低倾向性,而类别2具有消极应对高倾向性。本文的讨论部分对模型参数化、参数估计、模型识别、拟合优度评价、潜在分类与结果解释等潜在类别分析的各个环节进行了探讨并给出了合理的建议与意见。