论文部分内容阅读
目的:骨肉瘤是临床上最常见的原发性恶性骨肿瘤,起源于间叶组织,好发于儿童和青少年,主要发生在生长活跃的四肢骨的骨骺,尤其是胫骨近端和股骨远端。耐药、复发和高转移率是骨肉瘤治疗的难点所在。20%的骨肉瘤患者在诊断时已经发生肺转移,因此错过了治疗的最佳时机。此外骨肉瘤的肿瘤内和个体间的异质性使得骨肉瘤的临床治疗效果不一,多数患者后期易耐药复发。因此,迫切需要探索新的骨肉瘤预后生物标志物和治疗靶点,为患者提供个体化治疗,提高患者的生存率。随着基因组学技术的发展和大量的肿瘤相关生物数据的出现,通过生物信息学分析和实验验证相结合方法可以有助于寻找骨肉瘤早期筛查、预后及治疗的分子标志物。本课题拟应用生物信息学方法分析公共数据库中的骨肉瘤数据集,构建用于预测骨肉瘤转移、肿瘤免疫微环境及预后的风险模型,并针对关键基因黑色素瘤细胞粘附分子(melanoma cell adhesion molecule,MCAM)在骨肉瘤恶性生物学的中作用进行深入研究。方法:1.基于基因表达公共数据库(Gene Expression Omnibus,GEO)获取骨肉瘤微阵列表达数据集GSE14359、GSE12885、GSE21257的基因表达数据和临床相关数据,并筛选骨肉瘤与对照样本之间的差异表达基因(differentially expressed genes,DEGs)。2.利用STRING数据库构建差异表达基因蛋白质相互作用网络。并通过基因本体(Gene Ontology,GO)和京都基因与基因组百科全书(The Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析差异表达基因的潜在生物学功能。3.骨肉瘤预后模型的构建:基于单变量及多变量Cox回归分析筛选预后相关差异基因并构建多基因风险模型。通过Kaplan-Meier生存分析检测风险模型在评估骨肉瘤预后中的作用。通过总生存期进行受试者工作特征(receiver operating characteristic,ROC)曲线分析,评估预后模型的敏感性和准确性。4.骨肉瘤预后模型的临床应用价值:基于单因素和多因素风险回归分析评估预后模型相对于其他临床参数的独立预后价值,并分析其与骨肉瘤转移、年龄、性别之间的相关性。最后利用预后模型预测个体骨肉瘤患者使用不同抗癌药物的相对半抑制浓度(50%inhibition concentration,IC50)。5.骨肉瘤预后模型与肿瘤免疫微环境特征分析:通过单样本基因集富集分析(single-sample Gene Set Enrichment Analysis,ss GSEA)、ESTIMATE算法和TIMER数据库评估预后模型在预测肿瘤免疫微环境中的作用。通过ggpubr和limma R软件包预测不同风险评分骨肉瘤患者常见免疫检查点的表达。6.通过荧光实时定量PCR法和Western Blotting法,检测MCAM在三种常见骨肉瘤细胞系和正常成骨细胞中的表达水平。通过外部在线数据库再次验证MCAM在骨肉瘤组织中的表达水平及其与骨肉瘤患者预后的关系。7.MCAM功能研究:(1)构建MCAM小干扰RNA及过表达载体,并通过荧光实时定量PCR法和Western Blotting检测转染效率;(2)敲低MCAM的表达,通过CCK8实验,克隆形成实验和Transwell实验观察对骨肉瘤增殖、迁移、侵袭能力的影响;(3)过表达MCAM,通过CCK8实验,克隆形成实验和Transwell实验检测对骨肉瘤增殖、迁移、侵袭能力的影响。结果:1.以|log2FC|>1且P<0.05为筛选标准,在GSE14359数据集中,骨肉瘤与成骨细胞之间共筛选得到457个上调基因和256个下调基因。在GSE12885数据集中,与正常成骨细胞样本相比,人骨肉瘤样本中有368个上调基因和417个下调基因。通过Venn分析鉴定两个数据集中的共表达差异基因,结果显示有120个上调和82个下调的共表达差异基因。2.以蛋白互作得分大于0.4为筛选标准,对骨肉瘤中差异表达基因之间的相互作用关系进行分析,并构建共表达差异基因之间的蛋白互作网络。整个蛋白互作网络由178个节点和934条边组成。GO分析结果显示:差异表达基因显著富集于细胞趋化、分泌颗粒膜、GTP酶激活剂活性、细胞外基质组织、分泌颗粒管腔及整合素结合等。KEGG富集分析结果显示差异表达基因显著富集于Ras相关蛋白1(RAS-associated protein 1,RAP1)信号通路、丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信号通路、P53信号通路等。3.基于单变量及多变量Cox回归分析构建包含四个基因的预后风险模型,这四个基因分别是MCAM、谷氨酰氨肽酶(glutamyl aminopeptidase,ENPEP)、富含亮氨酸的重复序列蛋白1(Leucine Rich Repeat Containing 1,LRRC1)、羧肽酶E(carboxypeptidase E,CPE)。生存分析结果表明,模型能准确预测骨肉瘤癌患者总生存率。预后模型预测的1,3,5年生存率曲线下面积(area under the curve,AUC)值分别为0.903,0.871,0.829,表明该模型具有较好的预后评判价值。4.在多因素独立预后分析中,预后模型的风险评分(P<0.001,HR=1.323,95%可信区间(confidence interval,CI)=1.125-1.555)和Huvos分级(P<0.05,HR=0.519,95%CI=0.293-0.916)是骨肉瘤患者的独立预后因素。风险评分及四个关健基因MCAM、ENPEP、LRRC1和CPE的表达还与骨肉瘤患者的转移、年龄等临床特征相关。此外风险评分有助于预测个体骨肉瘤患者对阿西替尼、喜树碱、环巴胺、阿糖胞苷、蒽贝素、二甲双胍、紫草素、毒胡萝卜素和替吡法尼的敏感性。5.ss GSEA和ESTIMATE算法的结果显示,低风险评分的骨肉瘤患者免疫评分高(P=0.0015),肿瘤纯度低(P=0.0093),且具有高免疫细胞浸润水平和更活跃的免疫功能。此外高风险评分骨肉瘤患者的免疫检查点HAVCR2表达显著低于低风险评分骨肉瘤患者(P=0.001)。6.相对于成骨细胞,MCAM在三种人骨肉瘤细胞系中的m RNA和蛋白都处于高表达。外部数据库验证结果显示MCAM在骨肉瘤组织中高表达(P<0.001),且其低表达和骨肉瘤患者的总生存(overall survival,OS)和无转移生存(metastasis-free survival,MFS)获益相关(OS,p<0.001;MFS,p=0.0032)7.细胞试验研究发现,骨肉瘤细胞经si RNA转染处理后,与空白对照组比较,敲低MCAM表达能抑制癌细胞增殖、迁移、侵袭能力。而MCAM过表达组呈现相反现象,促进了骨肉瘤细胞的恶性表型。结论:1.基于多个骨肉瘤芯片成功构建并验证了能够准确预测骨肉瘤预后、转移、肿瘤免疫微环境、化疗药物敏感性的四基因风险评估模型;包括MCAM,ENPEP,LRRC1,CPE在内的关键基因是骨肉瘤转移的潜在预后生物标志物。2.MCAM在骨肉瘤组织和三种细胞系中均显著高表达,并可促进骨肉瘤增殖和转移能力,其可能是有前景的骨肉瘤早期诊断标志物和治疗靶点。这些研究发现为进一步的研究提供了依据,有望为阐明骨肉瘤发生发展机制带来新见解。