论文部分内容阅读
背景非小细胞肺癌(Non-small Cell Lung Cancer,NSCLC)治疗效果不佳,整体预后较差。其原因在于NSCLC生物学特性复杂,生物学行为难以预测,治疗无法个体精准化。目前对于NSCLC生物学特性的研究主要基于病理组织或外周血进行各项检测,包括常规病理检测与基因分子检测;病理检测的有创性限制其应用的广泛性,外周血液体活检无法反映肿瘤病灶内部与病灶间异质性、无法结合解剖位置信息、假阴性率过高等固有特点,使其在某种程度上无法准确描述肿瘤的生物学特性。而基于胸部CT应用人工智能(Artifitial Intelligence,AI)卷积神经网络(Convolutional Neural Network,CNN)的方法描述肿瘤的生物学特性,则可避免以上限制,并具有简单方便、能够结合解剖位置信息描述肿瘤异质性等优点。本研究以识别肺腺癌EGFR基因突变为起始,研究CNN识别NSCLC生物学特性的效能,并探索CNN是否能够预测酪氨酸激酶抑制剂类药物(Tyrosine Kinase Inhibitor,TKI)的无进展生存时间(Progression-free Survival,PFS)。材料与方法1、回顾性收集一线使用TKI药物的IIIB&IV期肺腺癌患者,明确患者PFS,一般临床特征,初诊时转移模式(寡转移、系统转移)与耐药进展模式(寡进展,系统进展)的具体情况,探索PFS时间与耐药进展模式的相关因素。2、回顾性收集具有治疗前胸部CT图像及EGFR基因状态信息的I-IV期肺腺癌患者,随机分成训练集与验证集,通过训练集数据训练CNN模型与影像组学(Radiomics)模型,在验证集上验证两种模型识别EGFR基因突变的效能。3、使用迁移学习方法,首先利用大样本肺结节CT图像建立能够判断良恶性的基础CNN模型,再将此模型迁移至EGFR基因突变识别上(使用第二部分训练集数据对模型进行微调,并在验证集中验证),明确迁移学习是否能够进一步提高CNN模型的识别效能。4、回顾性收集一线使用TKI药物的IIIB&IV期肺腺癌患者治疗前胸部CT图像与PFS时间等信息,训练CNN模型,尝试建立具有预测PFS长短的CNN模型。结果1、共收集270例IIIB&IV期患者进行PFS分析,212例患者进行进展模式分析。中位PFS为9 mos(0.5-36 mos),68.4%的患者为系统进展。EGFR基因突变位点(p=0.031)和脑转移(p=0.022,HR=1.353)与PFS相关,18外显子与20外显子突变患者PFS短于19外显子与21外显子突变患者(1 mos,1mos vs.10 mos,8 mos,p=0.031),有脑转移患者PFS短于无脑转移患者(8 mos vs.10 mos,p=0.022)。初诊时转移模式、骨转移与进展模式相关。初诊时寡转移患者容易发生寡进展(p<0.0001,OR=11.32)。骨转移患者较少发生寡进展(p=0.008,OR=0.43)。2、共收集1010例I-IV期肺腺癌患者(510例突变型患者,500例野生型患者),根据患者一般临床特征随机分成训练集(810例)与验证集(200例),CNN与影像组学模型识别EGFR基因突变的AUC值分别是0.810和0.740,CNN识别EGFR基因突变最佳决策点的特异度为0.753,敏感度为0.813,CNN模型的识别效能优于影像组学模型(p=0.0225)。3、共收集8963例肺结节(6583例恶性结节,2380例良性结节)患者术前胸部CT图像及术后病理资料,根据患者一般临床特征随机分入训练集(7084例)与验证集(1879例),训练集资料所建立的基础CNN模型判断结节良恶性的AUC值为0.941,最佳决策点特异度为0.865,敏感度为0.849。在使用第二部分训练集图像对基础CNN模型进行微调后,其识别EGFR基因突变的AUC值为0.863,最佳决策点的特异度为0.897,敏感度为0.763。高于第二部分所建立的CNN模型的AUC值(0.810,p=0.013)。4、共收集348例IIIB&IV期一线使用TKI药物的肺腺癌患者。全部患者一线使用TKI药物中位PFS为9个月(0.5-46 mos),PFS小于等于9个月的患者为短PFS(200例),大于9个月者为长PFS(148例)。根据患者一般临床特征及PFS长短随机分成训练集(278例)与验证集(70例),通过训练集建立的CNN模型在验证集上预测PFS长短的AUC值为0.647,最佳决策点特异度为0.641,敏感度为0.615。结论:1、使用TKI药物的肺腺癌患者PFS时间主要与EGFR基因突变位点及是否脑转移相关,患者耐药进展模式与初诊时转移模式及转移部位相关;2、所建立的CNN模型能够高效能地识别EGFR基因突变,识别效能优于影像组学模型;3、所建立的基础CNN模型能够高效能地判断肺实性结节良恶性,迁移学习之后能够更好地识别肺腺癌患者的EGFR基因突变;4、所建立的CNN模型能够初步预测使用TKI药物的肺腺癌患者PFS长短,但效果不佳。