论文部分内容阅读
多阶段随机抽样是公共卫生开展人群抽样调查的常用设计。多阶段抽样设计下获得的样本具有复杂样本的特征,存在群效应或数据不独立,若不考虑抽样设计,通常会低估抽样误差或增加统计推断Ⅰ类错误的风险。由于复杂样本误差估计形式较复杂,目前常用统计软件均默认采用极群方差估计策略来简化样本结构,即假设样本来自于一阶段整群抽样,忽略除第一阶段抽样外的所有抽样设计,从而实现对误差的近似估计。然而,在初级抽样单元入样比较高时,后继抽样阶段对误差的贡献不可忽略,极群方差估计策略可能导致无效的误差估计。本文旨在介绍考虑多阶段抽样设计下的误差估计方法,并通过对现实数据进行多阶段模拟抽样,探讨在不同抽样设计下,极群方差估计策略和考虑多阶段抽样设计下的误差估计差异。模拟结果显示,随初级抽样单元入样比的增加,极群方差估计策略估计的误差出现不同程度的偏倚,且随入样比增加偏倚加重;而考虑多阶段抽样设计下的误差估计则较准确反映误差水平,可得到准确的统计推断结果。