论文部分内容阅读
背景:肺癌是最常见的恶性肿瘤,也是癌症死亡的主要原因。晚期肺癌患者的预后很差,而早期肺癌患者的预后良好,因此早期发现并识别出恶性肺结节患者,是降低肺癌死亡风险和疾病负担的重要二级预防措施。目前通过电子计算机断层扫描(CT)筛查肺结节的健康体检日益普及,但据此判别肺结节性质,需要医生具备丰富的临床医学知识和医学影像学知识,这对于基层医生和年轻医务工作者难度都很高。主要依据CT影像判别肺结节性质,以辅助临床医生准确地识别出恶性肺结节,对早发现、早治疗肺癌患者,改善病人的预后具有重要意义。肺癌中非小细胞肺癌是最为常见的类型,其预后差。肿瘤淋巴结转移分期(TNM)系统虽普遍使用,但具有相同阶段的患者的生存时间差异很大,另外现有的预后预测模型,大多不适合病人在治疗前预测其预后,因为模型多依据有创检查、甚至是外科手术来获取病理组织检查结果。目前肺癌病人都会接受CT检查,如果能够主要借助CT影像准确预测病人预后,就能有针对性地为病人选择适宜治疗方案,提高病人的生存率,改善病人预后。而影像组学就是从医学图像中快速提取大量特征的方法,进一步的分析该高维数据,可以开发判别、预后预测模型。但组学数据有变量维数过高、混杂和噪声多以及非线性相关的特点。能够较好的处理高维组学数据的模型将在本研究中进行比较讨论。目的:本论文旨在基于影像组学数据,探讨构建肺癌筛查中的肺结节性质判别模型,以及非小细胞肺癌预后预测模型,并开发临床易用工具。以辅助医生选择适宜的治疗方案,提高临床决策效率,从而提高肺癌生存率。资料与方法:在肺结节性质判别模型研究中,共纳入了 875例肺结节患者。从每例患者的CT图像中提取影像组学特征。以常规变量和所有影像组学特征构建随机森林判别模型;使用最小绝对收缩和选择算子(LASSO)进行影像组学特征筛选,并计算影像组学得分,以常规变量和影像组学得分构建logistic判别模型。通过曲线下面积(AUC)针对训练集和验证集评价两种模型。基于AUC较高的模型开发简易应用工具。在非小细胞肺癌预后预测模型研究中,共纳入了 1302例非小细胞肺癌患者。从每例患者的CT图像中提取影像组学特征。使用常规变量和所有影像组学特征构建随机生存森林和深度生存神经网络两种模型;使用LASSO-COX方法筛选影像组学特征,并计算影像组学得分,以常规变量和影像组学得分构建COX比例风险模型。采用一致性指数(C-index)针对训练集和验证集评价三种模型,并基于C-index最高的模型开发简易应用工具。结果:收集875例肺结节患者和1302例非小细胞肺癌患者的CT影像,手动勾画、分割其“感兴趣”区域(ROI),每位患者均提取1288个影像组学特征。在肺结节性质判别模型研究中,构建随机森林判别模型,训练集AUC及其95%置信区间为0.762(0.716,0.808),验证集AUC及其95%置信区间为0.755(0.674,0.836);从1288个影像组学特征中筛选出17个特征,算得影像组学得分,采用逐步回归法构建了 logistic判别模型并筛选出影像组学得分、年龄和性别,训练集AUC及其95%置信区间为0.837(0.797,0.877),验证集AUC及其95%置信区间为0.804(0.733,0.875)。经对两模型评价比较,logistic判别模型效果较好,并以其绘制肺结节性质判别列线图,校准曲线吻合度良好。在非小细胞肺癌预后预测模型研究中,构建了随机生存森林模型,C-index及其95%置信区间为0.811(0.771,0.850),验证集C-index及其95%置信区间为0.810(0.762,0.858);构建了深度生存神经网络模型,训练集C-index及其95%置信区间为0.820(0.784,0.857),验证集C-index及其95%置信区间为0.823(0.775,0.871);从1288个影像组学特征中筛选出9个影像组学特征,算得影像组学得分,采用逐步回归法构建COX模型并筛选出影像组学得分、年龄、吸烟和肺癌家族史,训练集C-index及其95%置信区间为0.840(0.806,0.874),验证集C-index及其95%置信区间为0.849(0.810,0.888)。经评价比较,COX模型的预测效果最佳,以其绘制预测列线图,校准曲线吻合度良好。结论:影像组学特征对于判别肺结节性质和预测非小细胞肺癌预后都具有重要意义。基于影像组学特征判别肺结节性质的logistic模型的效果较好,由此得到的判别列线图简便易用。基于影像组学特征的预测非小细胞肺癌预后的COX模型的效果较好,由此得到的预测列线图简便易用。