论文部分内容阅读
背景:肝细胞癌是肝脏主要恶性病变,是当今世界范围内三大癌症杀手之一。血管瘤是肝脏常见的良性肿瘤。两者的治疗方法截然不同:肝细胞癌的最佳治疗方法是手术切除、肝移植或进行介入治疗,而血管瘤通常不需要特殊干预,仅当出现明显症状时才需要处理,因此两者间准确的鉴别诊断对于后续治疗方案的确定具有重大的临床意义。虽然肝细胞癌与血管瘤有着完全不同的病理结构,但却常常有相似的影像学表现,使得传统依靠人眼主观视觉进行诊断的方式准确性与一致性有限。影像组学是近年来医学影像领域新兴的研究方向,其通过从医学图像中提取的高通量特征,结合机器学习等分析方法辅助疾病诊断、分级、预后预测等,有望用于肝细胞癌与血管瘤的鉴别诊断。目的:探索基于增强MR的影像组学鉴别肝细胞癌(Hepatocellular Carcinoma,HCC)与血管瘤(Hepatic Hemangioma,HHE)的价值。方法:本文从南方医科大学南方医院回顾性地收集了 134例患者共186个病灶(HCC:105个,HHE:81个),从每个患者的普美显MRI增强扫描数据中选择肝胆管期图像用于分析。由两名经验丰富的影像科医生在最大横截面积层面手动勾画出病灶后,对病灶区域提取影像特征(共373个,包括一阶统计特征、灰度共生矩阵、邻域灰度差矩阵、游程矩阵以及灰度区域大小矩阵特征)。首先,通过组间相关系数(Inter-class Correlation Coefficient,ICC)评估特征的可重复性,T检验或Mann Whitney U检验比较特征在疾病组间的差异,ROC分析评估特征的分类能力。其次,分别通过LASSO算法、基于MIC(Maximal Information Coefficient)的 mRmR(minimal-Redundancy-maximal-Relevance)算法进行特征选择。最后训练支持向量机建立鉴别诊断模型。数据集根据采集时间划分为训练集(81个HCC、60个HHE)、测试集(24个HCC、21个HHE),训练集用于特征选择、建模,测试集用于最终模型的测试。模型的分类性能采用5次10折交叉验证进行评价,评价指标包括ROC曲线下面积(AUC)、敏感性、特异性以及分类准确率。两种特征选择方法下最终模型的测试ROC采用Delong检验进行比较。结果:特征可重复性评估的结果显示超过90%(343/373)的特征ICC>0.9。这部分特征中超过23%(80/343)在HCC组与HHE组间的差异具有显著性(经过Bonferroni校正p<0.000146),在之后的ROC分析结果中,分类性能最高的是灰度区域大小矩阵的 LZHGE 特征(Large Zone High Gray-Level Emphasis),其AUC值为0.81(p<<0.01),敏感性为0.70,特异性为0.80,分类准确率为0.74。在特征选择与分类器训练中,两种不同的算法得到的模型在训练集与测试集上均有着较好的分类性能。根据LASSO算法选择的11个特征,在训练集的平均AUC值、敏感性、特异性、准确率以及相应的95%置信区间分别为0.834(0.807-0.861)、0.795(0.755-0.836)、0.667(0.631-0.701)、0.741(0.716-0.764),测试结果为:AUC值0.851,敏感性0.791,特异性0.667,准确率0.733。而基于MIC的mRmR算法选择的15个特征获到的分类器平均AUC、敏感性、特异性、准确率分别为:0.915(0.891-0.940)、0.888(0.855-0.922)、0.803(90.756-0.850)、0.852(0.824-0.879),测试结果 AUC 为 0.892,敏感性 0.875,特异性 0.760,准确率0.822。基于MIC的mRmR算法下建立的模型分类性能略优于前者,但两模型的测试AUC差异无统计学意义(p = 0.21)。结论:通过对普美显MRI增强扫描肝胆管期图像提取影像组学特征,结合机器学习方法能够较好地鉴别诊断肝细胞癌与血管瘤,为影像科医生临床诊断提供有利的辅助手段,对于精准医疗的实现具有重要意义。