论文部分内容阅读
背景:肺癌是起源于支气管粘膜上皮的恶性肿瘤以肺腺癌最为常见,约占比50%,发病率仅次于乳腺癌位居第二位,是导致癌症相关死亡的最重要原因。肺癌患者的整体生存期不容乐观,五年生存率仅为19%。细胞外囊泡是由多种活性细胞分泌的纳米级别的双层脂质囊泡,其内携带有蛋白质、脂质、多糖、DNA、RNA等多种生物分子;是细胞与细胞之间沟通的桥梁。研究表明,细胞外囊泡通过将致癌蛋白和核酸转移至肿瘤细胞来调节受体细胞的活性,调控肿瘤的发生、发展与转移;同时作为一种新型的标志物可用于多种肿瘤的诊断及预后预测。而细胞外囊泡在肺腺癌患者预后预测的应用价值仍不明确。目前采取的以肿瘤病理学分型和分期为依据的传统方法无法准确地评估肺腺癌患者的个体化预后情况;因此,我们急需构建精确的个体化预后预测模型来为临床医生个体化治疗方案的选取提供理论基础。目的:为肺腺癌患者构建细胞外囊泡相关的预后预测基因标签,建立个体化预后预测模型;为临床医生选取最优治疗方案提供了新的理论依据。方法:1.在TCGA肺腺癌队列中构建细胞外囊泡相关的预后基因标签(1)在ExoCarta数据库检索获得人类细胞外囊泡相关基因。从TCGA数据库中获取肺腺癌患者的转录组数据及临床资料。利用limma包和单因素COX回归分析获得影响肺腺癌患者预后的细胞外囊泡相关的差异表达基因。(2)通过LASSO回归运算获得最佳预后预测基因标签;运用回归系数与基因表达数据构建风险评分模型。依据风险评分将TCGA肺腺癌队列分为高、低风险组;利用Kaplan-Meier曲线比较两组患者之间生存差异;ROC曲线验证模型的预测效能。2.在GEO数据集中验证细胞外囊泡相关预后预测基因标签(1)在GEO数据库中下载序列GSE68465患者的基因芯片数据及临床信息,并对数据进行标准化处理。利用上文构建的预后相关风险评分模型计算获得GSE68465序列中每位患者的风险得分。(2)依据风险评分将患者分为高、低风险组;绘制Kaplan-Meier曲线比较两组患者间的生存差异;绘制ROC曲线对风险评分模型的特异性及敏感性进行验证。3.分析TCGA肺腺癌队列高、低风险组患者之间的差异(1)利用GO数据库对两组患者之间差异表达基因的分子功能、生物过程和细胞成分进行注释,分析差异表达基因的功能。利用KEGG数据库对高、低风险组患者的差异表达基因进行通路富集分析。(2)利用ssGSEA评分对TCGA肺腺癌队列患者的免疫细胞和免疫相关通路进行打分,评估高、低风险组患者的免疫浸润情况。结果:1.在TCGA肺腺癌队中构建以19个细胞外囊泡相关基因为基础的预后预测基因标签在Exocarta数据库中检索选取720个人类细胞外囊泡相关基因。引用“limma”包和单因素COX回归分析获得52个细胞外囊泡相关的影响肺腺癌患者预后的差异表达基因。利用LASSO回归分析计算获得19个细胞外囊泡相关基因并参与构建风险评分模型。依据风险评分的中位数将患者分为高、低风险组。Kaplan-Meier曲线显示低风险组患者的整体生存期明显优于高风险组患者;多因素回归分析证实风险评分是TCGA肺腺癌患者整体生存的独立预测因素;ROC曲线1年至3年的曲线下面积分别为:0.720、0.72和0.735。2.在GSE68465数据集中验证细胞外囊泡相关预后预测基因标签依据上述风险评分模型计算GSE68465数据集中每名患者的风险评分,依据风险评分的中位数将患者分为高、低风险两组。绘制高、低风险两组患者的Kaplan-Meier曲线,结果提示高风险组患者的整体生存期较低风险组患者相比有明显的劣势;多因素回归分析证实风险评分是GEO肺腺癌患者整体生存的独立预测因素;ROC曲线1年至3年的曲线下面积分别为:0.686、0.645和0.627。3.TCGA肺腺癌队列高、低风险组富集分析GO功能富集分析表明高、低风险组患者间的差异表达基因主要富集与多种免疫相关的生物学途径和分子功能。KEGG分析提示两组间的差异表达基因主要与“ECM-receptor interaction”通路密切相关。4.TCGA肺腺癌队列高、低风险组免疫分析ssGSEA免疫打分证实高、低风险组患者之间巨噬细胞、Th2细胞、TIL、Treg B细胞、中性粒细胞、T辅助细胞、iDC、肥大细胞和NK细胞存在显著差异;APC共抑制、CCR、HLA、经典MHC I、副炎症反应和II型干扰素免疫相关功能存在显著差异结论:1.细胞外囊泡相关基因与肺腺癌患者的预后密切相关。构建以19个细胞外囊泡相关基因组成的预后预测基因标签。2.细胞外囊泡参与细胞外基质的降解、重塑;增加糖酵解途径,为肿瘤细胞营造缺氧条件,改变肿瘤微环境进而促进肿瘤的发生、发展;影响患者的预后与生存。3.细胞外囊泡参与肿瘤细胞与免疫细胞间的沟通,通过调节免疫相关分子的表达来调节相应免疫细胞的功能,抑制或促进机体抗肿瘤免疫功能。