论文部分内容阅读
研究目的(1)分析和比较不等概率、分层以及整群三个典型复杂抽样特征对点估计和抽样效率的影响,为有限总体人群健康测量数据的复杂抽样参数估计方法提供依据。(2)采用Rasch模型,从量表项目水平评价中文版EQ-5D量表的整体以及5个维度在不同慢性病人群中的适用性。(3)在系统掌握陕西省居民健康现状及其人群分布特征的基础上,采用复杂抽样多变量模型,分析EQ-5D的5个维度、EQ-5D指数和VAS的主要影响因素。(4)基于健康效用、健康效用的边际效用、卫生服务利用、患病率和人口数,构建效用调整卫生服务利用指标,并利用该指标开展常见慢性病人群的卫生服务利用成本-效用分析。研究方法(1)以基础抽样权重、比例权重和标准化权重的联合权重校正样本的差异代表性。根据区域(陕南、关中和陕北)和城乡(城市和农村)的联合分类,将全省分为6层。将县区设置为群标识。设定仅加权(CSw)、分层加权(CSsw)、分层整群加权(CSscw)三种复杂抽样校正方法。通过比较三种校正方法与完全随机法(SRS)的设计效应,分析不等概率、分层和加权对参数估计及参数方差估计的影响。选用的估计对象包括均数、率、线性回归的系数和Logistic回归的系数。(2)采用基于Rasch模型的软件RUMM2030分析EQ-5D量表。在项目水平评价量表整体以及5个维度在12类常见慢性病人群的适用性。量表整体测量效果的评价方法包括RSM和PCM模型的比较、总体拟合效果、个体离散指数、标的性、残差主成分分析;量表各维度测量效果的评价方法包括项目拟合残差、阈值、DIF。(3)采用单变量统计分析方法系统描述陕西省全人群的健康现状及健康的人群分布特征。通过构建多变量模型确定5个健康维度、EQ-5D指数和EQ-5D VAS的主要影响因素。EQ-5D维度的影响因素分析采用Logistic回归模型,EQ-5D指数和EQ-5D VAS的影响因素分析采用Tobit回归模型。统计分析的工具为SAS和STATA,分析过程采用CSscw法进行校正。。(4)基于健康效用、健康效用的边际效应、卫生服务利用、患病率以及人口数构建效用调整卫生服务利用指标,利用该指标开展慢性病人群卫生服务利用的成本-效用分析。采用复杂抽样Tobit模型估计健康效用的边际效应。利用患病率、人数和健康效用的边际效用计算慢性病患病的QALY损失。计算和比较不同慢性病的效用调整卫生服务利用及其总量。主要研究结果(1)经过三类权重对差异代表性的校正,20-24岁、25-29岁、30-34岁三个年龄段的人口构成比分别由4.91%、5.23%、4.72%增加至10.32%、7.47%和6.86%。校正后的全省以及各层年龄-性别结构与总体基本一致。人均卫生支出和慢性病患病率的估计值由校正前的932元和19.2%下降至897元和14.1%。三种校正方法的设计效应显示,对抽样效率影响由大到小依次是整群、不等概率和分层。例如,在家庭人均卫生支出的估计中,CSw法、CSsw法和CSscw法的设计效应分别为1.6、1.58和46.6;在慢性病患病率的估计中,CSw法、CSsw法和CSscw法的设计效应分别为1.04、1.04和14.52。考虑复杂抽样特征后,回归模型中部分因素的系数的标准误和P值增加较多,且P值跨越了0.05的置信水准。例如,CSscw法线性回归模型中区域(陕南)的P值由<0.0001增大至0.45,就业(在业)的P值由<0.01增大至0.11;CSscw法Logistic回归模型中区域(关中)的P值由0.03增大至0.31,饮酒的P值由<0.001增大至0.11。(2)单个维度的缺失率均低于1%,五个维度的不完整率为0.13%。健康状态为“11111”和“33333”的调查对象各占81.8%和0.14%。除贫血和精神类疾病外,所有人群的PCM模型和RSM模型比较的似然比检验P值都小于0.001。慢性病人群的个体离散指数均大于未报告慢性病人群和全人群,在0.5-0.8之间。个体位置均数都大于0且偏度系数都小于0。残差主成分分析的结果显示所有人群的第一主成分特征值均大于1.4,小于1.4的特征值方差百分比在50%和70%之间。全人群、未报告慢性病人群和其它慢性病人群的5个项目的残差都比较严重地偏离了[-2.5,2.5]区间。有8个人群在焦虑/沮丧维度的项目残差大于2.5。12类常见慢性病的城乡-DIF和性别-DIF分析的P值均大于0.05,全人群的有无慢性病-DIF分析的P值小于0.01。(3)(A)在城乡调查对象的特征方面:农村的在业人口和文盲的比例比城市分别高22.3和18.1个百分点,高等教育(大专及以上)和从不参加体育锻炼的比例比农村分别低10和25.1个百分点。(B)在人群健康的总体现状方面:五个维度报告健康问题的比例由高到低依次是疼痛/不适(10.9%)、焦虑/沮丧(5.6%)、行动能力(4.6%)、日常活动(3.9%)、自我照顾(2.4%)。EQ-5D指数和VAS的中位数分别为0.89和84.51。VAS与EQ-5D指数的相关系数为0.47,疼痛/不适维度与VAS和EQ-5D指数的相关系数分别为-0.42和-0.89。(C)从不同健康指标的人群分布特征来看,女性、年龄较高者、陕北地区人群、农村地区人群、两周患病者、患慢性病种类较多者、丧婚离婚者、无业失业者、受教育程度较低者、人均家庭收入较低者、参加农合或城乡合作医疗者的健康状态较差。各类健康指标在年龄、教育水平、人均家庭收入和共患慢性病数量四个因素上呈现梯度分布。例如,四个年龄段人群的EQ-5D指数中位数分别为0.899、0.894、0.881和0.848,报告的疼痛/不适健康问题的比例分别是1.27%、3.56%、6.96%和13.14%。(D)未报告慢性病人群健康状态的主要影响因素包括年龄、文化程度、家庭人均收入和两周患病,其中年龄、文化程度、家庭人均收入在各个健康指标上的作用呈现梯度效应。例如,三个较高年龄段人群在行动能力维度的OR值分别为3.41、10.23和23.18,在EQ-5D指数上的系数分别为-0.183、-0.355和-0.507。(E)慢性病人群健康状态的主要影响因素包括文化程度、家庭人均收入、共患慢性病数量和两周患病,其中文化程度、家庭人均收入和共患慢性病数量在各个健康指标上的作用呈现梯度效应。例如,三个共患慢性病数量较多人群在日常活动维度的OR值分别为1.65、2.82和3.62,在VAS得分上的系数分别为-4.8、-7.7和-12.8。年龄对未报告慢性病人群健康的影响比慢性病人群大。(4)(A)15岁以上人群中,患病率最高的是高血压病(9.92%),边际效用最大的是肿瘤(-0.3863)。每年因患肌肉运动系统疾病的QALY损失最大(828.3年)。但是,以上指标在60岁以上年龄组中有些差异。例如60岁以上人群中边际效用最大的是精神类疾病(-0.3831),QALY损失最大的是高血压病(473年)。(B)在15岁以上人群中,慢性病人群的门诊量和门诊费用分别占总量的56.6%和61.99%。门诊病人中健康状态相对较差的是脑血管病(0.74)和肿瘤(0.78),肿瘤的两周门诊就诊率(33.1%)和次均门诊费用(1045元)都最高;单位门诊服务利用最高的也是肿瘤,单位效用门诊次数为11.1次/年,单位效用门诊费用为1342元。(C)15岁以上人群中,慢性病患者的住院次数、住院费用和住院天数分别占总量的45%、49%、51%。住院病人中健康状态最差的是脑血管病(0.76),住院率和住院费用最高的是肿瘤,分别为67.4%和10043元,精神类疾病的住院天数最多(32.6天)。单位效用住院次数和住院费用最高的是肿瘤,分别为0.8次/年和11882元,单位效用住院天数最高的是精神类疾病(39.4天)。以上指标在60岁以上年龄组中也有一些差异。例如,住院率最高的是脑血管病(51.7%),住院天数最高的是传染病(23.1天),单位效用住院次数最高的是脑血管病(0.72次/年),单位效用住院天数最高的是传染病(28.7天)。(D)15岁以上人群中,肌肉运动系统疾病的效用调整卫生服务利用总量最高,门诊次数约为179万次,门诊费用约为4200万,住院次数约为56000次,住院费用约为12亿元。15-59岁与60岁以上人群中,不同慢性病的效用调整卫生服务利用总量的构成具有一定的差异;15-59岁人群中,肌肉运动系统疾病、消化系统疾病和肿瘤的比重相对更高,而60岁以上人群的脑血管病、高血压病、心脏病和糖尿病的比重更高。研究结论(1)不等概率主要影响点估计的偏度,整群主要影响标准误的大小。复杂抽样人群健康测量的评价方法必须考虑复杂抽样特征,忽略复杂抽样特征很可能带来有偏估计和错误的统计推断。(2)中文版EQ-5D量表的项目设置基本符合测量假设,但模型拟合效果不是很好。发现的主要问题是量表对较好健康状态的敏感性不强,易产生较高天花板效应。总体上,慢性病人群的拟合效果好于非慢性病人群,生理维度的拟合效果好于心理维度。(3)人群健康状态的主要影响因素包括年龄、文化程度、家庭收入、共患慢性病数量。以上因素内的不同水平对健康指标的影响呈现梯度分布的特点。四个重要影响因素有两个属于社会经济因素,反应了社会经济发展不均衡引起的健康公平性问题。(4)效用调整卫生服务利用指标的构建,为基于横断面调查数据的卫生服务利用的成本-效用分析提供了新方法。慢性病人群效用调整卫生服务利用的分析结果,确定了人群中慢性病的防治重点,可为慢病防治项目的资源优化配置提供参考依据。