论文部分内容阅读
乳腺癌是女性最常见的恶性肿瘤和主要的肿瘤死亡原因之一,其发病率和死亡率都呈逐年上升的态势。影像学检查新技术如对比增强乳腺X线摄影(contrast-enhanced mammography,CEM)以及人工智能技术(artificial intelligence,AI)在医学影像学的逐步应用,对乳腺癌的精确诊断起着重要作用。CEM在注射碘对比剂后获得一张减影图像和一张低能图像,能同时反映病灶的形态特征和血供情况。CEM包含了丰富的图像特征,而人工智能可以通过复杂算法挖掘医学图像中蕴含的生物学本质。本研究基于CEM及人机混合模型,结合人工智能和人类临床经验的优势,探索CEM图像定性、定量的多层次特征与乳腺肿块良恶性的关系,并构建CEM乳腺肿块人机混合智能模型,最后基于多阅片者多病例方法,评估该模型对影像科医生的辅助诊断效能。本研究主要分为以下两个部分。一、基于对比增强乳腺X线摄影的乳腺肿块人机混合模型构建目的:基于CEM图像的BI-RADS特征、低能图影像组学特征、减影图影像组学特征构建人机混合模型以鉴别乳腺肿块良恶性,并通过可解释性模块探索特征对于模型分类的影响。材料与方法:回顾性收集南方医院2018年1月至2020年1月临床或影像学检查发现的可疑乳腺肿块并在本院行CEM检查的患者160例,由高年资医生提取BI-RADS特征并勾画减影图中乳腺肿块的感兴趣区域(region of interest,ROI)。基于肿块ROI,分别提取低能图和剪影图中肿块的影像组学特征。经特征预处理后,基于肿块的BI-RADS特征、低能图影像组学特征和减影图影像组学特征,以肿块病理良恶性为金标准,分别构建以逻辑回归、K-近邻、决策树、随机森林、支持向量机、XGBoost为分类器的基模型,经调参后取最优基模型构建人机混合模型。此外,将所有特征混合使用构建机器学习模型与人机混合模型进行性能比较。最后使用可解释性模块(SHapley Additive exPlanations,SHAP)分析特征对于模型预测的影响。结果:基于BI-RADS特征、低能图影像组学、减影图影像组学特征构建的最优基模型的曲线下面积(area under curve,AUC)分别为0.886、0.826、0.763。基于三个最优基模型构建的人机混合智能模型效果优于单一模型以及基于其他组合构建的融合模型,取得0.931的AUC值和0.971的敏感性。将不同特征分别建模的人机混合模型性能也优于混合所有特征构建的机器学习模型(AUC=0.905)。SHAP可解释模块表明BI-RADS特征中低能图病灶边缘毛刺、病灶内部不均质强化、明显强化、流出型动态增强模式对模型预测影响显著。低能图影像组学模型中,一阶统计学特征对模型预测贡献度最大。而减影图影像组学模型中,重要的特征均为纹理特征,但是特征的贡献度均偏低。结论:①基于三种最优基模型构建的人机混合模型性能优于单一模型及其他基模型组合,也优于混合所有特征构建的模型,提示将不同类型特征分别建模并融合,有利于提高特征利用率并进一步提升模型性能。②CEM减影图的强化特征在鉴别肿块良恶性中有重要作用,而减影图影像组学模型中,特征贡献度均偏低,考虑与减影过程中信息丢失有关。二、基于多阅片者多病例研究设计的乳腺肿块人机混合模型的辅助诊断价值研究。目的:基于多阅片者多病例(multi-reader multi-case)实验设计,使用Obuchowski-Rockette统计方法,探索人机混合模型对不同年资医生鉴别CEM图像中乳腺肿块良恶性的辅助价值。材料与方法:根据预实验结果,由4名医生阅读158例可以提供足够的评估能力,从而测算医生在不同阅片方式下的诊断效能。本部分由4名不同年资乳腺影像诊断医生(2名1-3年经验的低年资医生;2名5年以上经验的高年资医生)在独立阅片和模型辅助下分别对160例CEM肿块进行评估,判断乳腺肿块的BI-RADS分类。模型辅助下阅片时,除了个人经验,医生还可以在输入特征之后结合模型输出的肿块恶性概率以及贡献度最高的特征作为参考。以病理良恶性为金标准,使用AUC、敏感性和特异性评估每位医生的阅片效能,最后使用Obuchowski-Rockette统计方法比较不同年资医生在不同阅片方式下的诊断效能差异。结果:4名影像科医生独立阅片的平均AUC为0.892[0.854-0.926],平均敏感性和特异性分别为0.786[0.627-0.864]和0.875[0.762-0.952];模型辅助下的平均 AUC 为 0.933[0.911-0.960],敏感性和特异性分别为 0.879[0.839-0.932]和0.863[0.810-0.905]。基于 Obuchowski-Rockette 法计算两种阅片方式平均 AUC,其差异具有统计学意义(P=0.0205)。结论:①在模型辅助诊断下,不同年资的医生在判断病灶良恶性的AUC、敏感性都有一定程度的提高,对于模棱两可的病例能够得到更准确的诊断,说明人机混合模型可以提高影像科医生的诊断效能;②基于Obuchowski and Rockette统计学方法比较不同年资医生在模型辅助前后的诊断效能差异,结果表明医生在模型辅助下阅片的平均AUC要高于独立阅片下的平均AUC,且差异具有统计学意义,提示该结果有望应用到实际工作中。