论文部分内容阅读
目的:通过高通量提取并筛选胃癌CT影像特征,联合胃癌患者术前相关临床特征,探索CT影像组学在术前预测高低风险组织类型胃癌中的价值。方法:回顾性分析2012年1月-2017年12月在某医院连续诊治的经手术病理证实的570例胃癌病例,其中乳头状腺癌7例、高/中分化管状腺癌285例、低分化腺癌247例、黏液腺癌21例和印戒细胞癌10例,依据文献资料的研究结论将其分为高风险组织类型胃癌组和低风险组织类型胃癌组。所有样本按照2:1的比例被随机分为训练组和验证组,以供模型构建和验证。患者术前CT检查前规范准备为:空腹服水和肌注低张药;多排螺旋CT(MSCT)行全胃平扫、动脉期和静脉期三期扫描,并进行CT-TNM分期,扫描层厚为0.625mm,平扫、动脉期和静脉期轴位重建层厚5 mm,静脉期冠状位重建层厚3 mm,软组织对比重建,矩阵512×512,图像重建后以无压缩DICOM数据传输至PACS。影像科腹部组主治医师采用ITK-SNAP软件分割CT图像中胃癌原发病灶作为兴趣区域,选取静脉期轴位CT图像的肿瘤最大层面进行分割,再先后由影像科副主任医师和主任医师进行校正。采用多因素Logistic回归分析筛选出与高低风险组织类型胃癌相关性较大的术前临床信息,并以此构建术前临床信息特征模型。用基于Python的Pyradiomics包从所有分割的兴趣区图像中提取影像组学特征,再依次用最大相关最小冗余(mRMR)、最小绝对收缩和选择算法(LASSO)和逐步回归三种特征选择算法筛选出最优特征,并以此建立影像组学特征标签。融合影像组学特征标签与临床信息特征,采用多因素Logistic回归分析构建预测高低风险组织类型胃癌的影像组学模型。所有模型都是在训练组上建立,并在验证组上进行测试检验。采用受试者工作特征(ROC)曲线下面积(AUC)对模型性能进行评估,并计算其特异度、灵敏度和准确度。另外,校正曲线和Hosmer-Lemeshow检验被用来评价影像组学模型的鲁棒性。结果:训练组中包含男性278名,女性103名;验证组中包含男性133名,女性56名,单因素分析结果显示两组的特征分布无统计学差异。多因素逻辑回归分析结果发现,年龄、性别和CT-M分期这三个临床特征与不同风险组织类型胃癌相关性较大,因此将这些特征纳入到临床特征模型。从每个胃癌CT影像中提取的影像组学特征总数为985个,其中包括18个强度特征、12个形状特征、75个纹理特征和880个小波特征。筛选得到5个与高低风险组织类型胃癌密切相关的特征:“Wavelet.HLglszmZonePercentage”,“Wavelet.LHglszmGrayLevelNonUniformity”,“Wavelet.LHglszmZoneVariance”,“Wavelet.HHglrlmLowGrayLevelRunEmphasis”,“Wavelet.LLFirstorder90Percentile”。临床特征模型的AUC在训练组和验证组中分别为60.32%(95%CI:0.546-0.660),61.26%(95%CI:0.530-0.694),特异度、灵敏度和准确度在训练组和验证组分别为0.6613、0.5282、0.5932和0.7264、0.4337、0.5979。影像组学标签的AUC在训练组和验证组中分别为67.60%(95%CI:0.622-0.729),65.20%(95%CI:0.572-0.731),两组中特异度、灵敏度和准确度分别为0.8710、0.4205、0.6504和0.8113、0.4458、0.6508。融合术前临床信息特征和影像组学特征的影像组学模型的AUC在训练组中为70.69%(95%CI:0.655-0.758),在验证组中为69.49%(95%CI:0.618-0.771),两组中特异度、灵敏度和准确度分别为0.7634、0.5487、0.6535和0.7736、0.5181、0.6614。影像组学模型预测高低风险组织类型胃癌的性能在三者中表现最好,其次是影像组学标签,最差的是临床特征模型。校正曲线和Hosmer-Lemesshow检验结果(p=0.5627)显示CT影像组学模型的预测结果与临床观察结果具有良好的一致性。结论:1.影像组学标签预测高低风险组织类型胃癌较术前临床特征模型有更好的效果。2.结合临床特征和CT影像组学特征的联合预测模型比单一预测模型的诊断效能更高。3.CT影像组学模型在术前无创预测高低风险组织类型胃癌中有一定的参考价值。