论文部分内容阅读
癌症在全球范围内严重危害着人类的健康,发病率和死亡率均居高不下。肿瘤患者的早期预后预测至关重要,而缺乏可靠的肿瘤预后预测工具是导致患者高死亡率的重要原因之一。医学影像如磁共振成像(Magnetic Resonance Imaging,MRI)、电子计算机断层扫描(Computed Tomography,CT)等,是常规肿瘤评估工具,其依靠影像科医生的人工阅片给出对肿瘤的定性评估。近年来,随着人工智能技术的发展以及影像组学(Radiomics)概念的提出,为科研人员研究肿瘤预后提供了新的思路,使MRI、CT等医学影像作为可靠的、精准的、定量的预后评估工具成为可能。基于人工智能和医学影像大数据的影像组学方法已在部分肿瘤的预后预测中取得成功,然而,在晚期高级别浆液性卵巢癌(High-Grade Serous Ovarian Cancer,HGSOC)和颅底脊索瘤(Skull base chordoma,SBC)领域中,国内外研究较少,尤其是在SBC领域尚属空白。本文针对这一问题进行了三个方面的研究:(1)研发了基于影像组学的肿瘤无进展生存期(Progression-Free Survival,PFS)预测方法;(2)实现了基于晚期HGSOC患者的术前CT增强影像定量的预测其PFS;(3)实现了基于SBC患者的术前常规MRI影像定量的预测其PFS。本文的主要工作及贡献如下:一、研发了基于影像组学的肿瘤PFS预测方法。首先,从科研合作医院的影像归档和通信系统(Picture Archiving and Communication System,PACS)中获取医学影像数据,数据为医学数字成像和通信(Digital Imaging and Communications in Medicine,DICOM)格式;其次,采用影像科医生手工分割病灶的方式获得感兴趣区域(Region of Interest,ROI),ROI由3位合作医院的影像科医生使用ITK-SNAP(www.itksnap.org)软件进行三维人工分割,其中2名影像科医生分别在患者影像上绘制肿瘤区域,另一名资深的影像科医生确定最终的ROI,使用由2名影像科医生分别勾画的ROI提取的影像组学特征计算其组内相关系数(Intra-class Correlation Coefficient,ICC)验证影像组学特征的稳定性,定义ICC大于0.75为特征稳定,分割文件存储为mha格式;采用最近邻插值(Nearest Neighbor Interpolation)算法对肿瘤原始图像和ROI分别进行归一化处理,消除扫描设备和扫描参数(Slice Thickness、Pixel Spacing等)不一致对影像组学特征的影响;再次,基于Hugo J.W.L.Aerts以及前人的研究,本研究选择提取620个定量的影像组学特征,包括:17个直方图特征,8个形状特征,51个纹理特征,544个小波特征;使用单特征分析和Elastic Net进行降维和特征选择,并建立影像组学标签;最后,使用Kaplan-Meier生存分析和Log-rank test确定预后因素和PFS之间的关系;单变量和多变量Cox比例风险模型计算预后因素的一致性指数(Harrell’s Concordance Index,C-index),并预测关键时间点PFS的个体概率;用时间依赖C-index评估单变量Cox模型的判别准确度;DeLong’s test用于比较各个模型的预测性能;通过1000次有放回重采样计算C-index和AUC的95%置信区间(Confidence Interval,CI);使用校准曲线(Calibration Curve)评估模型预测的变异程度,并将其预测概率与真实概率进行比较;使用Hosmer-Lemeshow test检验校准曲线;所有统计测试均为双侧,显著性定义为P<0.05。二、实现了基于影像组学的晚期HGSOC患者PFS预测。在此回顾性研究中,实验共入组142名晚期HGSOC患者,入组患者至少有18个月的随访期,随访时间为18.8-81.8个月,中位随访时间38.8个月。根据手术时间和住院地点将患者分为三组:训练集、内部测试集来自四川大学华西第二医院,独立外部测试集来自河南省人民医院。采集患者术前腹部骨盆增强CT影像数据并提取620个3-D影像组学特征。由LASSO(Least Absolute Shrinkage and Selection Operator)回归选出的4个影像组学特征构建的影像组学标签成功地将三个队列的患者分别划分为具有显著统计学差异的高/低风险两组。此外,影像组学标签和影像组学Nomogram预测18个月和3年内疾病进展风险时表现出高准确率且显著优于临床模型。三、实现了基于影像组学的SBC患者PFS预测。在此回顾性研究中,共入组148名SBC患者,其中64名患者出现疾病进展,随访时间为4-122个月,中位随访时间52个月,全部数据来自首都医科大学附属北京天坛医院。根据手术时间将患者分为训练集和测试集。采集患者术前头部横轴位T1磁共振成像液体衰减反转恢复序列(Fluid Attenuated Inversion Recovery,FLAIR),T2加权成像,增强T1 FLAIR三个MRI序列,并分别提取620个3-D影像组学特征,共计提取1,860个3-D影像组学特征。影像组学标签由18个影像组学特征构建,并被归一化为离散变量(高风险,中等风险和低风险)和连续变量(0-1之间)。作为离散变量的影像组学标签可成功的将测试集患者分为高风险、中风险、低风险组,各组的无进展生存期具有显著地统计学差异。作为连续变量的影像组学标签的C-index和预测5年进展风险的判别准确率均较高且优于9个潜在的临床预后因素。影像组学可用于肿瘤患者的预后评估,影像组学标签是肿瘤定量的、可靠的预后标志物;影像组学以低成本的、非侵入式的方式在围手术期进行预后评估,不仅可直接影响制订临床治疗和随访方案,而且对实现个体化治疗和延长患者生存期有积极的意义,是对精准医学的重要补充。