论文部分内容阅读
目的:脑卒中是全球严重的公共健康问题之一,是全球范围内第二致死原因和成人致残的主要原因。中国脑卒中的防控形势及其严峻,每年每10万人口中,城市有大约116人因脑卒中死亡,农村有111人因脑卒中死亡。此外,脑卒中在中国的复发率仍然很高为11.2%。脑卒中的防控效果不容乐观。因此,需要探索适合我国国情的脑卒中防控方案。根据若干关于脑卒中预防和治疗的指南,采用常规治疗与控制高危因素相结合的防治效果较好。但是临床预防及治疗决策都是以循证证据为依据的,目前脑卒中的预防和治疗的指南主要还是依据国外一些循证证据。而脑卒中的发病是有种族和地区差异的。因此需要结合最新设计合理的前瞻性流行病学数据和严谨的统计学方法建立适合我国的脑卒中预测模型。本研究基于2013年建立的东北农村地区自然人群队列,于2015-2018年获得最新的随访数据,利用LASSO法对20余个脑卒中危险因素进行精简和整合,引用列线图将Cox回归结果量化、图形化、可视化。首次建立了适合我国基层脑卒中一级及二级预防应用的脑卒中发病风险预测模型。并通过巢式病例对照研究分析血浆非靶向代谢组学与致死性脑卒中的发病关系,旨在找到脑卒中新的预测因子,以便未来能更新优化预测模型,提高脑卒中风险预测能力。研究方法:第一部分:于2013年,采用分层整群随机抽样方法,在辽宁省东部、南部和北部地区随机抽取3个县,之后在每个县随机抽取一个镇,最后在每个镇随机抽取8-10个村。对该地区35岁及以上的常驻村民进行现况调查,获得脑卒中的患病情况,并采用LASSO法筛选多因素Logistic回归分析的变量,建立脑卒中危险因素模型。分析与脑卒中患病相关的危险因素。第二部分:基于2013年建立的人群队列,于2015-2018年进行随访。然后随机选取其中两个县的人群合并组成建模队列,剩余的一个县人群做验证队列。先采用单因素Cox回归分析的方法筛选出P值小于0.2的因素,初步筛查脑卒中发病的候选因素。之后采用LASSO法对纳入Cox回归模型的自变量做进一步筛选,确定最终入选Cox回归模型的自变量。依据入选自变量的回归系数绘制相应的列线图模型。采用Bootstrap自助抽样方法对列线图模型进行内部验证,用验证队列对模型进行外部验证。加入eGFR建立新的模型。通过比较两组模型的NRI和IDI,评估模型的改善程度。最后通过决策分析评估模型的应用性。第三部分:在前期建立的队列中选取符合条件的高血压患者,随机抽取29例高血压发生致死性脑卒中病例,并按照1:1匹配同等随访期限且未发生脑卒中的符合匹配条件的高血压患者作为对照。应用超高效液相色谱-质谱联用法,从正离子和负离子两种电离模式,对所有纳入病例的基线血浆进行非靶向代谢组学检测。对原始数据归一化处理后,进行偏最小二乘法-判别分析和正交偏最小二乘法-判别分析,通过多元变量统计分析的VIP值和折叠倍数筛选出差异代谢物,通过通路富集分析等方法,筛选与高血压致死性脑卒中发病相关的代谢物及其通路。结果:第一部分:对基线11956人进行分析,其中脑卒中病史1151人,患病率:9.63%。单因素分析发现28个差异性变量。应用LASSO法,最终以11个危险因素建立多因素Logistic回归模型。多因素回归分析显示,既往高血压、糖尿病及冠心病史增加脑卒中的患病风险(高血压OR:1.58,95%CI:1.36-1.84;糖尿病OR:1.43,95%CI:1.19-1.72;冠心病:OR:1.30,95%CI:1.03-1.63)。有高血压及脑卒中家族史的人群脑卒中患病风险增加(高血压OR:1.63,95%CI:1.39-1.89;脑卒中OR:1.63,95%CI:1.39-1.92)。从事中重度劳动强度的人群脑卒中患病风险减少(中度OR 0.85,95%CI:0.74-0.98;重度OR 0.55,95%CI:0.47-0.65)。高尿酸增加脑卒中的患病风险(OR:1.55 95%CI:1.22-1.95)。第二部分:对建模队列(7608)和验证队列(3799)人群的基线特征进行比较,发现两组在年龄、吸烟饮酒史、文化程度、既往史和家族史存在一定的差异。两组人群背景不大一样,可以认为验证队列是较为理想的外部验证人群。应用LASSO法,取lambda值等于lambda.0.5se,共纳入7个自变量,分别为年龄、性别、既往高血压、脑卒中或TIA史、AST、婚姻状况和体力活动强度。建立列线图模型显示,随着年龄增长,得分升高;男性得分为17.9;婚姻状况里离异和丧偶得分偏高,分别为13.51及13.93;高血压病史得分为25.64;脑卒中及TIA病史得分为26.90;中轻度体力活动得分分别为9.25和11.01;高AST得分为15.36;随着列线图模型总评分的增高,相对应的1年,3年,4年脑卒中发病风险上升。对建模队列和验证队列绘制ROC曲线显示建模队列:1年风险截断值=0.007736473,AUC=0.823;3年风险截断值=0.02182493,AUC=0.787;4年风险截断值=0.02827864,AUC=0.792。验证队列:1年风险截断值=0.01054306,AUC=0.780;3年风险截断值=0.02366501,AUC=0.756;4年风险截断值=0.03019615,AUC=0.753。新加入eGFR建立的列线图模型显示,随着年龄增长,得分升高;男性得分为19.69;婚姻状况里未婚、离异和丧偶得分偏高分别为4.11,14.44及14.60;高血压病史得分为28.11;脑卒中及TIA病史得分为28.11;中轻度体力活动得分分别为10.24和11.28;高AST得分为17.06;随着列线图模型总评分的增高,相对应的1年,3年,4年脑卒中发病风险上升。GFR模型的建模队列1年截断值=0.007804812,AUC=0.822;3年截断值=0.02245559,AUC=0.789;4年截断值=0.02910098,AUC=0.793。GFR模型的验证队列一年截断值=0.009084268,AUC=0.773;3年截断值=0.02612931,AUC=0.758;4年截断值=0.03244035,AUC=0.755。NRI和IDI评价新旧模型预测能力差异不大。第三部分:病例组与对照组的年龄、性别和基线血压分级构成一致。身高、体重、腰围、总胆固醇、甘油三酯、低密度和高密度脂蛋白、空腹血糖及吸烟饮酒情况亦无差异(P均>0.05)。归一化后的正负模式下PLS-DA和OPLS-DA分析结果均显示分组分离趋势明显。结合OPLS-DA分析得到的VIP值,根据筛选阈值P-value<0.05,|log2FC|>0.263且VIP>1,最终得到55个差异代谢物,阳离子模式45个,阴离子模式10个,其中上调23个,下调32个。富集通路分析共筛选到6个显著性小于0.05的通路。涉及自噬调节、致病性大肠杆菌感染、糖基磷脂酰肌醇锚生物合成、D-谷氨酰胺和D-谷氨酰胺代谢、咖啡因代谢等通路。结论:本研究发现东北农村人群脑卒中的患病率为9.63%。首次采用LASSO法筛选多因素COX回归分析的变量,并利用列线图构建危险因素模型。建立了适合我国基层脑卒中一级及二级预防应用的量化、图形化、可视化的脑卒中发病风险预测模型。同时应用代谢组学方法发现了谷氨酸盐及阿魏酸等多种代谢物可能参与高血压脑卒中的发病过程,为高血压脑卒中的预防和发病机制探索提供了新的方向。