论文部分内容阅读
冠状动脉粥样硬化性心脏病(冠心病,Coronary artery disease,CAD)是我国最常见的心血管疾病之一,据国家心血管病中心发布的数据显示,我国城乡居民冠心病死亡率持续上升,2015年达到110/10万人口,较2012年增加近3倍,发病率和死亡率的不断增加给我国社会发展带来沉重的卫生经济负担。作为一项可防可治的疾病,冠心病的筛查及合理的临床决策是改善患者预后、降低疾病负担的关键环节。既往研究已在冠心病筛查及临床决策优化方面进行了大量探索。在冠心病筛查方面,研究者们提出了多种针对冠心病的风险预测模型。1979年,Diamond和Forrester教授应用年龄、性别、冠心病症状建立了经典的Diamond-Forrester模型,该模型临床应用简便,是一项里程碑式的工作。随后,为了进一步改善模型的预测效能,后续研究者不断纳入新变量建立了多个优化模型(如冠心病联盟临床评分、杜克临床评分等),这些优化的模型极大提升了预测效能。临床决策方面,一系列的证据和指南不断地更新推动着诊疗决策的规范,对于复杂冠心病,更是推荐应用心脏团队进行以患者为中心的诊疗决策。尽管既往工作取得了丰硕的成果,我们仍需认识到冠心病筛查和临床决策合理化方面仍存在需要评价及优化之处。在冠心病筛查中,一方面,传统临床模型均开发自西方队列,用于建模及验证的人群在临床特点、人种、地域等方面都存在差异,模型在人群中的效能尚不明确;另一方面,现有模型纳入大量临床变量,很难应用于大范围早期筛查,尚需高效、简便的筛查工具。在临床决策中,一方面,虽然指南和证据不断推出,但我国的血运重建决策合理程度尚缺乏评价;另一方面,虽然心脏团队被认为可能改善冠心病决策,但既往研究提示心脏团队决策的可重复性存疑,最佳的心脏团队实践方案仍需优化。针对上述问题,本研究开展了一系列冠心病筛查模型和临床决策的评价和优化研究。第一部分为冠心病筛查模型的评价及优化研究。该部分中,我们系统评价了现有主要冠心病筛查模型的预测效能,并建立了一项基于面部图片深度学习的冠心病筛查模型以进一步优化冠心病筛查。第二部分为冠心病临床决策的评价和优化研究。该部分中,我们开展了我国稳定性冠心病患者血运重建决策的适宜程度评价,并进行了复杂冠心病心脏团队决策实践方案优化的探索。主要的研究结果如下:第一部分 冠心病筛查模型的评价和优化一、冠心病筛查模型准确性的系统评价研究背景:多种冠心病风险预测模型被开发用于疾病筛查。但由于建模及验证人群的异质性,各模型的实际应用价值尚不确切。本研究旨在对各种预测冠心病的模型进行系统回顾,阐明其预测效能。方法:计算机检索PubMed、Embase和中国知网。纳入研究冠心病预测模型的文章。检索时限为建库至2020年9月30日。由2名评价员独立按照纳排标准筛选文献,提取建模信息、预测效能等资料。结果:研究共纳入30篇文章,汇总了 19个经过外部验证的预测模型。在模型外部验证中,17个模型获得受试者工作曲线下面积(Areaunder curve,AUC)>0.7的效能。经典的Diamond-Forrester模型、更新的Diamond-Forrester模型、杜克临床评分、冠心病联盟临床评分的外部验证AUC在0.49-0.87之间,中国人群的外部验证 AUC 在 0.57-0.78 之间。结论:大部分模型具有中等的预测效能,经典的冠心病预测模型在各人群中预测效能差异大,仍需基于中国本土数据的冠心病筛查模型。二、人工智能分析面部图片预测冠心病的可行性研究背景:多种面部特征与冠心病的风险增加相关,可能成为一种便捷的疾病筛查手段。本研究旨在开发并验证了一种基于面部图片深度学习的冠心病预测算法。方法:在这项多中心横断面研究中,我们入选了9家中国心脏中心接受冠状动脉造影或计算机断层摄影血管造影(Computed tomography angiography,CTA)的患者,根据入选时间分为模型开发组和测试组。应用模型开发组患者面部图片建立预测冠心病(至少1支冠脉狭窄≥50%)的深度卷积神经网络算法,并在测试组中进行预测效能测试。模型评价指标为AUC、灵敏度和特异度。结果:在2017年7月至2019年3月之间,研究连续招募了来自8家中心的5796名患者,并将其随机分为训练组(90%,n=5216)和验证组(10%,n=580)进行算法开发。在2019年4月至2019年7月之间,来自9家中心的1013名患者被纳入测试组。算法在测试组中的AUC为0.730(95%置信区间0.699-0.761)。使用高灵敏度(0.80)的取值时,算法在测试组中的灵敏度为0.80,特异度为0.54。该算法的 AUC 高于传统的 Diamond-Forrester 模型(0.730 vs.0.623,p<0.001)和冠心病联盟临床评分模型(0.730 vs.0.652,p<0.001)。结论:基于面部照片的深度学习算法可能帮助中国人群进行冠心病检测。这项技术有望在门诊进行冠心病患病风险评估或在社区进行冠心病筛查,仍需进一步研究以开发临床可用的工具。第二部分冠心病临床决策的评价及优化研究一、稳定性冠心病临床决策的适宜程度评价研究背景:2016年,为规范我国血运重建手术指征选择,国家心血管病中心起草了《中国冠状动脉血运重建适宜性标准的建议(试行)》。本研究旨在依据该指南评价稳定性冠心病患者冠脉血运重建指征选择的适宜程度。方法:本研究是一项多中心、横断面研究,研究入选于4家心脏中心行择期冠脉造影发现至少一支冠脉狭窄≥50%的稳定性冠心病患者。以《中国冠状动脉血运重建适宜性标准的建议(试行)》评价冠脉血运重建指征选择的适宜程度。结果:研究入选2016年8月至2017年8月5875例稳定性冠心病患者。根据血运重建适宜性标准评判,18.1%(1064/5875)的患者指征选择不适宜,43.6%(2560/5875)的患者指征选择可能适宜,38.3%(2251/5875)的患者指征选择适宜。在376例行冠状动脉旁路移植术(Coronary artery bypass graft,CABG)的患者中,3.5%(13/376)指征选择不适宜;在3452例行经皮冠状动脉介入治疗(Percutaneous coronary intervention,PCI)的患者中,20.9%(723/3452)的指征选择不适宜。在 2047例行药物治疗的患者中,16.0%(328/2047)的指征选择不适宜。不适宜的指征选择多出现在无心绞痛症状的患者中(p<0.001)。指征选择不适宜率在术者间差异显著(5.3%-25.0%,n=42)。结论:在这项大型多中心研究中,18.1%的患者治疗决策不适宜,不适宜率在术者间差异显著。20.9%的PCI和16.0%的药物治疗指征选择不适宜,CABG指征选择适宜程度较好。二、心脏团队最佳决策方案的探索性研究背景:虽然指南推荐通过心脏团队进行复杂冠心病患者决策,但尚缺乏最佳实施方案的推荐,决策稳定性缺乏评估。我们旨在评估团队间的决策稳定性,并分析决策差异的影响因素,进而提出最佳实践方案。方法:本研究是一项解释性续贯混合方法研究,其中包括:(1)一项评估团队间决策稳定性的横断面研究,该研究回顾性入选复杂冠心病患者,并组织4支心脏团队对入选患者进行治疗决策;(2)一项定性研究,该研究对所有心脏团队成员进行半结构化地访谈,以分析与决策差异相关的影响因素。主要终点为团队间决策一致性Kappa值。访谈数据通过归纳主题分析产生与决策一致性相关的主题和亚主题。结合定性、定量数据,我们解释了每个亚主题如何影响决策一致性,并据此提供了改善决策一致性的建议。最后,我们通过整合建议、指南和既往实践经验,提供了一套团队决策实践方案。研究预先计算了患者样本量,并通过理论饱和度确定了访谈者的样本量。结果:研究从连续的冠脉造影注册登记中随机入选101例复杂冠心病患者。邀请了 16位专家随机建成了 4支心脏团队对入选患者进行回顾性决策。团队间的决策一致性中等(kappa为0.582)。决策可能会受到三个主题(专家素质,团队组成,会议流程)和十个亚主题(决策思维,对疾病和证据的理解,对其他学科技术的理解,性格,学习曲线,人员素质,团队成员数量,学科选择,各学科比例以及会议流程)的影响。提供了五个方面的建议,包括(1)专家选择,(2)专家培训,(3)团队组成,(4)团队培训和(5)会议流程。最后形成了一套心脏团队的实施方案。结论:心脏团队对于复杂冠心病患者的决策一致性中等。根据与决策差异相关的因素,提出了五项改善心脏团队决策稳定性的建议,并产出了一套详细的心脏团队实施方案。仍需进行随机对照试验以进一步验证该实践方案。