论文部分内容阅读
目的:通过模拟构建存在不同混杂结构的暴露因素模型和结局模型,在设定结局模型是广义线性模型的情况下,探索比较三种针对连续型暴露因素的广义倾向性评分(GPS)估计法:GPS-OLS,GPS-Boosting以及CBGPS法均衡混杂效应的性能以及对暴露效应估计精度影响。将GPS应用于营养流行病学领域,通过三种GPS估计法均衡混杂效应,探索红肉类食物摄入量与血脂异常之间的真实关联。方法:本研究通过蒙特卡洛模拟,分别生成大样本(N=1000)与小样本(N=400)两种情况,模拟了16种不同混杂结构存在的暴露因素模型和结局模型,通过GPS-OLS、GPS-Boosting以及CBGPS法分别估计GPS,根据逆概率加权法构造权重,依据各协变量与暴露因素相关系数变化情况来判定三种GPS估计法均衡混杂效应的能力,通过比较偏倚程度以及均方误差判定对暴露效应估计精度的影响。应用实例选择2013年同煤研究的研究对象作为本研究对象来源,应用GPS-OLS、GPS-Boosting以及CBGPS法均衡混杂因素,诊断比较三种方法均衡混杂效应性能,并基于边际结构模型,通过加权回归估计红肉类食物摄入量效应,探索红肉类食物摄入量与血脂异常的真实关联。结果:模拟结果显示,在不同混杂结构存在的情形下,CBGPS法所估计出的评分值通过逆方差加权法构造权重后,均衡混杂效应的能力最佳,明显优于GPS-OLS法、GPS-Boosting法。在暴露效应估计精度方面,CBGPS法也能明显降低暴露效应估计的均方误差以及偏倚程度,估计精度优于GPS-OLS法、GPS-Boosting法,同时大样本与小样本的模拟结果基本一致。实例研究共纳入3 919名研究对象。其中,患有血脂异常的研究对象共1 815(46.31%)名。多因素分析结果显示,通过传统逐步回归法调整人口学资料、吸烟、饮酒等因素后,日常膳食中红肉类食物的摄入量与血脂异常关联没有统计学意义(OR=1.0004,95%CI:-0.0002-0.0011)。通过CBGPS法均衡混杂效应,各协变量与红肉类食物摄入量相关系数接近于0,混杂因素的均衡效果最佳,膳食中增加红肉类食物摄入量可能引起患血脂异常的风险升高(OR=1.0007,95%CI:0.0001-0.0013)。通过GPS-OLS法(OR=1.0013,95%CI:0.0007-0.0019)和GPS-Boosting法(OR=1.0011,95%CI:0.0005-0.0018)均衡混杂效应后,膳食中增加红肉类食物摄入量可能增加患血脂异常的风险。结论:不同混杂结构存在的情形下,CBGPS法所估计出的评分值通过逆方差加权后,均衡混杂因素的效果最佳,估计精度最高,明显优于GPS-OLS法、GPS-Boosting法。故建议应用广义倾向性评分时,可以优先选择CBGPS估计法。本研究发现日常膳食中,红肉类食物摄入量的增加可能引起患血脂异常风险的升高。