论文部分内容阅读
靶向治疗可明显改善非小细胞肺癌(Non-small cell lung cancer,NSCLC)患者的预后,治疗前进行肺癌驱动基因突变检测,全面了解NSCLC患者的基因突变谱,能够帮助临床医生为患者选择合适的靶向药物进行治疗,从而有效延长生存时间。因此,传统的单基因检测已经不能满足临床诊疗需求,需要进行多个驱动基因的联合检测。本研究利用非小细胞肺癌活检标本,分析NSCLC中多种驱动基因的临床病理特征,探索多种驱动基因之间的相关性及预后关系。此外,随着人工智能(Artificial intelligence,AI)在临床实践工作中的研究发展,多项研究已经开展利用人工智能技术预测EGFR基因突变的情况,对KRAS突变的研究较少,而二者基因变异对患者治疗方案的选择至关重要。本研究将组织病理学图像中的组织形态学特征与分子特征相关联,研究基于转换器的多实例学习模型辅助预测NSCLC中常见的基因突变类型的可行性。第一部分非小细胞肺癌中多基因变异的临床病理特征及预后关系的探讨目的:NSCLC的多基因联合检测为分子靶向治疗提供更加全面的指导信息,对取材量少的标本尤为重要。本研究旨在探索非小细胞肺癌活检标本中EGFR与KRAS、BRAF、ALK、MET、RET、HER2、ROS1和PIK3CA等8种驱动基因变异之间的临床病理特征及预后关系。方法:回顾性分析河北医科大学第四医院2018年-2020年的587例非小细胞肺癌患者的活检组织标本,收集所有患者的临床信息、病理信息,采用下一代测序技术(Next-generation sequencing,NGS)方法明确9种驱动基因的状态,分析相关临床病理特征及相关性,并对各种基因变异类型患者的生存预后差异进行比较。结果:1.NSCLC中9种驱动基因的总变异率为87.40%。EGFR基因突变率为55.03%,KRAS基因突变率为11.07%,PIK3CA基因突变率为6.13%,ALK融合、MET突变、HER2突变、RET融合、BRAF突变和ROS1基因融合突变率分别为5.45%、2.38%、2.38%、1.87%、1.87%、1.19%。2.临床病理特征中,EGFR突变在女性、腺癌、不吸烟、Ⅳ期患者中高于其他患者(均为P<0.001)。KRAS突变在男性、吸烟患者中更常见(均为P<0.001)。ALK融合更易发生在60岁以下的患者(P<0.001),而MET突变更易发生在60岁以上的患者(P=0.04)。PIK3CA突变更常见于男性、鳞状细胞癌、吸烟患者中(均为P<0.001)。BRAF突变更多见于男性(P=0.028)。ROS1基因融合突变更常见于晚期NSCLC的患者(Ⅲ期和Ⅳ期)(P=0.003)。RET融合、HER2基因突变与患者性别、年龄、组织学类型、临床分期以及是否吸烟均无相关性(P值均>0.05)。3.Spearman相关性分析显示,EGFR基因突变与KRAS突变、BRAF突变、ALK融合、MET突变、RET融合、HER2突变、ROS1融合和PIK3CA基因突变之间均存在负相关性(均为P<0.05)。4.生存分析显示,EGFR突变型NSCLC患者的OS明显优于KRAS突变、BRAF突变、ALK融合、MET突变、RET融合、HER2突变、ROS1融合和PIK3CA突变型的患者(均为P<0.05)。第二部分预测非小细胞肺癌中EGFR、KRAS基因突变的多实例学习模型的研究目的:肺癌的分子检测对于患者分层和治疗选择至关重要,EGFR相关突变患者对酪氨酸酶抑制剂(TKI)敏感,而KRAS突变患者对TKI治疗无效,因此筛选EGFR和KRAS基因突变对患者治疗有重要意义。人工智能技术在临床实践工作中的应用逐渐成熟,本研究旨在通过病理图像的相关信息预测基因突变类型,利用人工智能技术,开发一种客观的、定量和可重复的人工智能学习模型,来预测非小细胞肺癌中常见的基因突变类型。方法:收集2017年-2020年河北医科大学第四医院的934例10%中性福尔马林固定石蜡包埋(Formalin fixed paraffin embedding,FFPE)、苏木精和伊红(H&E)染色的肺癌活检组织切片,组织学类型包括鳞状细胞癌、腺癌、腺鳞癌和肉瘤样癌。通过自动数字切片扫描仪在40X放大率下扫描组织病理切片,以转换成数字化的全切片图像(Whole Slice images,WSIs)。同时,收集并整理了所有患者的EGFR、KRAS基因突变数据,突变的类型均由NGS方法确定。将全切片图像按照60%、20%、20%的比例分为训练集、验证集和测试集,开发基于转换器的多实例学习模型(Transformer-based MIL,T-MIL)自动预测EGFR和KRAS突变情况,并将T-MIL学习模型与已有的学习模型,包括基于注意力的多实例学习模型(Attention-based Multiple instance learning,A-MIL)、MIL-RNN架构模型(RNN architecture for bag representation generation in MIL,RNN-MIL)进行比较。结果:1.934例患者中,EGFR基因突变共453例(48.5%),KRAS基因突变共121例(13.0%)。结果显示,与EGFR基因突变相关的临床病理特征有性别、组织学类型、核级、核分裂分级、细胞学分级、腺体复杂程度和吸烟史(P<0.0001)。与KRAS基因突变相关的临床病理特征仅有性别和吸烟史(P<0.0001)。2.利用T-MIL模型预测EGFR基因突变状态,结果显示,模型的曲线下面积(Area under the cure,AUC)为0.711,敏感性为81.6%,特异性为55.6%,阳性预测值(Positive Predictive Value,PPV)为61.7%,阴性预测值(Negative predictive value,NPV)为77.5%。预测KRAS基因突变,T-MIL模型获得的AUC值为0.601,敏感性为56.2%,特异性为65.1%,PPV为13.2%,NPV为94.0%。3.T-MIL学习模型在通过组织病理图像预测EGFR基因突变方面的性能优于A-MIL模型和RNN-MIL模型(AUC值分别为0.711、0.4853、0.6767)。T-MIL学习模型在通过病理图像预测KRAS基因突变的性能优于A-MIL模型和RNN-MIL模型(AUC值分别为0.601、0.5753、0.5593)。结论:1.EGFR突变与KRAS突变、BRAF突变、ALK融合、MET突变、RET融合、HER2突变、ROS1融合和PIK3CA基因突变之间均呈负相关。EGFR突变型NSCLC患者的预后明显优于KRAS突变、BRAF突变、ALK融合、MET突变、RET融合、HER2突变、ROS1融合和PIK3CA突变型患者。2.T-MIL学习模型预测EGFR和KRAS基因突变的性能良好,且预测EGFR突变的性能优于KRAS突变。3.我们的研究证明了T-MIL学习模型在通过病理图像预测关键基因突变方面的性能优于A-MIL模型和RNN-MIL模型。