论文部分内容阅读
目的:比较基于四种机器学习算法的三种倾向值分析技术在平衡协变量和估计真实干预效应的能力。并以此控制中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)数据中的混杂因素、减少样本的选择偏倚,探索退休对老年人健康的潜在影响,以期了解老年人生活质量的变化,也为我国渐进式延迟退休相关政策的制定提供合理的科学参考。方法:1模拟研究:基于可观测假设的选择,运用Monte Carlo模拟构建具有不同样本量(n=500,2000)的二分类干预变量、连续型结果变量和6个分类或连续型协变量的假设研究,设定干预变量与协变量之间不同程度的非线性和非加性相关以及(54)和之间不同关联强度,评估基于四种机器学习算法(分类与回归树、随机森林、广义boosted模型、神经网络)的三种倾向值分析技术(最近邻居匹配、最佳匹配、遗传匹配)的性能。评价指标包括协变量平衡、相对偏倚、标准误、平均均方误、95%CI覆盖率。2实证研究:将倾向值分析方法运用于观察性数据进行实证,控制CHARLS调查数据中的混杂因素、减少样本的选择偏倚,探索退休对老年人健康的潜在影响。结果:1模拟结果(1)无论干预选择模型的复杂程度如何,相对其他三种机器学习算法而言,GBM平衡协变量的能力均为最优。一般而言,较好的协变量平衡导致偏差降低,遗传匹配也能同时实现更好的协变量平衡、较小的偏差和平均均方误。换言之,采用GBM估计倾向值合并遗传匹配技术,各项指标整体表现最优。(2)尽管匹配对之间的平均绝对距离较低,但最优匹配和最近邻居匹配的表现差别并不明显。2实证结果匹配前75%的协变量在退休组和工作组老年人之间不平衡,最大ASMD为1.150,平均ASAM为0.318。经过倾向值匹配,两组老年人基线特征的平衡情况有所改善。基于GBM的最近邻居匹配其最大ASMD为0.226,平均ASAM为0.071,各降低80.34%、77.67%,且除教育水平外,其余协变量在两组老年人之间均无统计学差异(P>0.05)。基于GBM的遗传匹配其最大ASMD为0.104,平均ASAM为0.057,各降低90.52%、82.08%,且所有协变量在两组老年人之间均无统计学差异(P>0.05)。遗传匹配比最近邻居匹配更好地实现协变量在两组之间的平衡。分析显示,退休组的自报身体疼痛率是工作组的0.57倍(95%CI:0.460.71),心智状况得分比工作组高1.27分(95%CI:1.041.52),抑郁情绪得分比工作组低1.75分(95%CI:-2.26-1.24),差异均具有统计学意义(p<0.001),而其余健康指标均无明显差异(p>0.05)。进一步分性别比较,也与全样本的分析结果基本一致。结论:(1)干预选择和观察到的协变量之间的真实形状通常未知,使用非参数方法对倾向值进行建模具有优越性能。GBM与遗传匹配相结合的方法在减少偏差和协变量平衡方面具有良好的结果,这不失为一种可推广的技术尝试,且有助于系统地选择更好的方法,而不是最熟悉或最容易实现的方法。由于任何一种新的组合方法都是基于可观测假设的选择,不可能尽善尽美,因此,需要更多的、基于真实数据的验证研究来确定新方法的性能。(2)总体而言,退休对老年人健康是有益的。退休可能是老年人进行健康促进活动和支持健康老龄化的适当时机,可有助于遏制不断增加的医疗保健成本。而提高退休年龄可能不利于老年人总体健康状况,因此,政府及相关行业部门在制定延迟退休政策时应该充分考虑潜在影响,更有针对性地制订与实施老年人的健康干预计划。