论文部分内容阅读
目的 应用生物信息学的方法对骨肉瘤(Osteosarcoma,OS)基因表达谱芯片进行分析,筛选OS关键候选基因和通路并加以分析,以期从分子水平探讨OS的发病机制。构建OS的诺模图(nomogram),以更加准确而个体化的预测OS患者的总生存期,为患者提供个性化的预后信息,并辅助临床医生为患者制定有效的治疗方案。方法 (1)从Gene Expression Omnibus(GEO)数据库下载OS的基因芯片数据集的原始数据,应用生物信息学方法筛选差异表达基因(differentially expressed genes,DEGs),随后利用R语言enrichplot软件包对差异基因进行基因本体论(Gene ontology,GO)及《京都基因和基因组百科全书》(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,通过STRING在线软件、Cytoscape及其插件cytoHubba及NetworkAnalyzer对所分析出OS的显著差异基因进行蛋白质-蛋白质相互作用(protein protein interaction,PPI)网络分析,以寻找关键(Hub)基因并进一步探讨Hub基因与OS的关系。(2)从监测、流行病学和最终结果数据库(The Surveillance,Epidemiology,and End Results,SEER)获得OS患者数据,根据单因素COX回归分析获得与OS预后相关的因素,进一步进行多因素COX回归分析,得到OS独立的预后因素。基于多因素COX回归分析结果构建诺模图。之后,使用一致性指数(index of concordance,C指数)及受试者工作特征曲线(receiver operator characteristic curve,ROC曲线)的曲线下面积(Area Under Curve,AUC)来量化识别所构建诺模图的准确性、验证其实用性。除此之外,对每个病人的风险评分进行计算,绘制了K-M曲线(Kaplan-Meier curve)生存分析。结果 (1)(1)对OS组及正常对照组所鉴定出的DEGs数据进行标准化处理,R软件共筛选408个DEGs(OS组/正常对照组),其中包括274个上调基因和134个下调基因。DEGs可见两组样本基因表达具有显著差异。(2)本研究对408个DEGs进行GO分析,DEGs主要涉及有丝分裂的核分裂、姐妹染色单体分离、染色体分离、有丝分裂的微管细胞骨架组织、细胞器裂变等生物学过程,所涉及的分子功能包括组蛋白激酶活性、趋化因子受体结合、微管运动、微管蛋白结合、趋化因子活性、RAGE受体结合等。DEGs基因产物主要集中于染色体区域、纺锤体微管、着丝点、着丝粒区域。KEGG通路富集分析结果显示,DEGs主要参与PI3K-Akt信号通路、趋化因子信号通路、T细胞受体信号通路、Toll样受体信号通路、TNF信号通路、p53信号通路及NF-κB信号通路等经典信号通路。(3)本研究将408个显著差异基因输入STRING工具,找出hub基因,按照MCC方法排名前10位的hub基因分别为CDC6、FEN1、OIP5、GINS2、RFC3、TRIP13、MCM10、AURKA、TIPIN、DTYMK。(2)(1)单因素COX分析显示,OS的预后与诊断年龄、分化程度分级、SEER分期、AJCC TNM分期、肿瘤大小、手术、淋巴结切除术以及放疗相关。多因素COX分析显示,诊断年龄、分化程度分级、SEER分期、肿瘤大小以及手术与否是OS的独立危险因素。(2)训练组的结果表明,诺模图的C指数值为0.766(95%CI,0.742-0.790)。验证组对应的C指数为0.760(95%CI,0.729-0.791)。通过ROC曲线分析,在训练组,1年、3年及5年的AUC分别为0.859、0.785、0.748。在验证组,1年、3年及5年的AUC分别为0.853、0.748、0.737。这些数据表明我们构建的诺模图能够有效的预测骨肉瘤患者的生存率。(3)在K-M生存曲线中,训练组中高风险组的五年生存率为41.8%(95%CI,37.5%-46.7%),低风险组为75.7%(98%CI,71.7%-79.9%)。同时,在验证组中,高风险组的五年生存率为37.8%(95%CI,31.8%-45.0%),低风险组为78.1%(98%CI,74.0%-82.4%)。结论 (1)本研究采用生物信息学的方法对OS基因芯片数据进行挖掘,发现了408个DEGs及其相关通路,分析表明OS的差异基因涉及了核分裂、微管细胞骨架组织、组蛋白激酶活性、微管运动等多个生物学过程和分子功能,参与了PI3K-Akt信号通路、趋化因子信号通路、p53信号通路及NF-κB信号通路等经典信号通路。而CDC6、FEN1、OIP5、GINS2及RFC3等基因在OS中高表达可能在其发生发展中起重要作用,为探究OS的分子机制及寻找新的治疗靶点提供了新思路。(2)本研究构建了基于5个变量预测骨肉瘤患者的总生存期的诺模图。C指数及ROC曲线在训练组和验证组对诺模图的性能均得到良好的验证。因此,该预测模型有潜力为骨肉瘤患者提供个体化生存预后评估,并辅助临床医生进行个性化的临床决策。