论文部分内容阅读
目的:在大型抽样调查研究中,比较不同患病率情况下简单抽样与复杂抽样对患病率估计的准确性和抽样误差的大小,为研究者在调查研究中采用合适的抽样方法估计患病率提供理论依据。方法:以2017年新疆维吾尔自治区某地州参加全民健康体检>15岁的常住人口381499人作为抽样总体,选择患病率不同的三种疾病(高血压22.35%,糖尿病13.86%,贫血0.95%),从总体中分别采用简单随机抽样(简单抽样)和分层三阶段PPS抽样(复杂抽样)模拟抽样100次。通过患病率的估计,比较患病率和总体率、抽样误差和95%置信区间(CI)包含总体参数的概率,评价两种抽样方法的适用性。结果:1.患病率为22.35%的情况下,简单抽样患病率估计的均值为22.11%,有一定低估;复杂抽样采用传统分析方法(不考虑抽样权重,方差估计采用wald法)时患病率估计的均值为21.65%、抽样误差为0.65%、95%CI包含总体率的概率为54%,出现了明显的低估;复杂抽样采用泰勒法(考虑抽样权重,方差估计是通过线性化获得统计量的线性近似值来估计方差)和刀切法(考虑抽样权重,方差估计是通过删除样本将剩余的样本构建为刀切样本,由这些刀切样本估计方差)时患病率估计的均值与总体率没有差异,泰勒法的抽样误差和95%CI包含总体率的概率有低估。2.患病率为13.86%的情况下,采用简单抽样患病率估计的均值为13.91%,与总体率没有差异;复杂抽样采用传统分析方法时患病率估计的均值为14.79%,出现了明显的高估,而抽样误差为0.42%、95%CI包含总体率的概率为38%,出现了明显的低估;复杂抽样采用泰勒法和刀切法时患病率的估计与总体率没有差异,泰勒法的抽样误差和95%CI包含总体率的概率有低估。3.患病率为0.95%的情况下,采用简单抽样患病率估计的均值为0.93%,与总体率没有差异;复杂抽样采用传统分析方法时患病率估计的均值为1.07%,出现了明显的高估,而抽样误差为0.03%、95%CI包含总体率的概率为26%,出现了明显的低估;复杂抽样采用泰勒法和刀切法时患病率估计的均值与总体率没有差异,泰勒法的抽样误差和95%CI包含总体率的概率有明显的低估。结论:大型抽样调查中,在高患病率疾病情况下,研究者应当采用复杂抽样设计,在中、低患病率情况下采用简单抽样也有较好的参数估计结果;在复杂抽样中应当避免使用传统分析方法,方差估计的方法优先选择刀切法。