论文部分内容阅读
目的:探讨基于贝叶斯估计的有序多分类多层模型在具有组内相关特性的层次结构数据中的应用,旨在获取准确的参数估计,以及研究该模型在实际分析过程中的方法学问题与其优越性,为涉及层次结构数据的分析提供科学实用的参考。方法:通过横断面调查获得数据常常遇到层次结构问题,层次结构数据特点突出:具有多层次变异、组内相关性、因变量呈有序多分类形式等。一般logistic回归分析难以满足这些条件。而有序多分类多层模型就能较好地解决该数据存在的问题。并且,由于现在已有文章证明有序多分类多层模型的传统参数估计方法对随机效应的估计是有偏的,而贝叶斯估计则能提高随机效应估计的精度。所以,基于贝叶斯估计的有序多分类多层模型应是处理层次结构数据更合理的方法。本文将首先介绍贝叶斯估计与MCMC法和有序多分类多层模型的基本理论,然后使用该方法对广州市居民控烟调查实例进行分析以获取分析结果、探讨分析步骤,并根据DIC与模型分析结果来进行有序多分类多层模型与有序多分类logistic回归的对比。完成以上步骤的同时会附上模拟结果踪迹的平稳性图及Raftery–Lewis诊断信息以评价参数迭代收敛情况。结果:广州市居民控烟调查实例:空模型分析显示数据具有组内相关性。有序多分类方差成分模型分析结果则表明,在控制其它变量及社区间控烟立法态度差异后,居民的性别、民族、在岗情况、吸入二手烟情况、控烟知识得分与吸烟危害知识得分对公共场所控烟立法态度有影响。而有序多分类随机系数模型则显示总体控烟态度越不积极的社区,其在岗居民的控烟态度也越不积极。相比之下,有序多分类logistic回归不能获取高层次信息,且由偏差信息准则与参数估计值的标准误分别可知有序多分类方差成分模型与随机系数模型对数据拟合程度较有序多分类logistic回归优与有序多分类随机系数模型的参数估计值比有序多分类logistic回归的估计值更为精确。残差分析也找出控烟积极性较高与不够高的社区。诊断信息方面,各模拟结果踪迹的平稳性图显示马尔科夫链收敛于目标分布,且Raftery–Lewis诊断信息显示实际迭代次数能满足获取准确p2.5、p97.5分位数所需的迭代次数,迭代结果可用与统计推断。结论:广州市居民控烟调查实例分析结果均对日后进一步的研究作出提示。而从实例分析结果与模型比较可发现有序多分类多层模型的优势明显,具体表现为:有序多分类多层模型对数据的拟合程度更优、能够通过残差分解减少参数估计偏倚、考虑到数据的组内相关性,能够通过该模型从数据中挖掘更多有意义的信息等。而贝叶斯估计由于考虑到方差成分的不确定性,因此提高了高层次变异的估计精度。所以,对于具有组内相关特性的层次结构数据,基于贝叶斯估计的有序多分类多层模型是合理,且值得推广的方法。