论文部分内容阅读
目的子宫内膜癌(Endometrial Carcinoma,EC)是女性生殖系统最常见的三大恶性肿瘤之一,发病率逐年升高且趋于年轻化。子宫内膜样腺癌(Endometrioid Endometrial Carcinoma,EEC)是EC的主要病理类型,约占所有EC的80-90%。早期(I期)EEC预后较好,但仍有部分患者由于复发或转移导致不良预后,目前临床上对于早期术后EEC的预后判断主要基于病理参数的风险分层,由于肿瘤具有异质性,其预后评估作用有限,因此需要探索更有效的预后生物标记物。micro RNA(mi RNA)是一类非编码单链小分子RNA,已被证实与多种癌症临床病理特征和生存预后相关,具有稳定性及组织特异性,可在血液及组织中被检测到,并存在同步表达。本研究通过对TCGA数据库中早期EEC的mi RNA芯片数据进行分析,筛选出与早期EEC患者预后相关的mi RNA,生物信息学分析其靶基因及相关功能,尝试构建EEC的mi RNA预后风险预测模型。方法1.从癌症与肿瘤基因图谱(The Cancer Genome Atlas,TCGA)数据库下载EEC组织样本(肿瘤及癌旁)的mi RNA、m RNA表达数据集和临床信息数据,使用R语言的edge R程序包对早期EEC肿瘤及癌旁组织的mi RNA、m RNA表达量进行对比分析,筛选出具有显著差异表达的mi RNA及m RNA(FDR<0.05且|log2FC|>1)。2.R语言的survival程序包进行单因素回归分析,从差异表达的mi RNA中筛选出与早期EEC病人总生存时间(Overall Survival,OS)有显著相关性的mi RNA(P<0.05)及与无进展生存时间(Progression-Free Survival,PFS)有显著相关性的mi RNA(P<0.05)。R语言time ROC及survival程序包绘制单个mi RNA的OS及PFS的受试者工作曲线(Receiver Operating Curve,ROC)。3.R语言的glmnet、survival及survminer程序包进行lasso回归分析及多因素Cox回归分析,得到与OS相关的mi RNA组合及PFS相关的mi RNA组合及相关mi RNA的回归系数。将回归系数代入公式Score risk=Expmi RNA1*Coef1+?+Expmi RNAn*Coefn,分别计算每个病人的OS风险评分及PFS风险评分。分别以OS风险评分中位值及PFS风险评分中位值为标准将病人分为高风险组及低风险组。4.R语言time ROC及survival程序包绘制ROC曲线及生存曲线,评估OS相关mi RNA组合及PFS相关mi RNA组合对早期EEC的预后价值。5.使用mi RWalk3.0及mi RDB数据库对OS相关mi RNA进行靶基因预测,取交集得到每个mi RNA的预测靶基因,根据mi RNA与m RNA的负向调控关系,EEC中表达上调mi RNA的预测靶基因与在EEC表达下调的m RNA取交集,EEC表达下调mi RNA的预测靶基因与表达上调的m RNA取交集。得到OS相关mi RNA的靶基因集合,同理得到PFS相关mi RNA的靶基因集合。6.DAVID数据库进行基因本体论(Gene Ontology,GO)及信号通路富集(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析,STRING数据库构建靶基因蛋白间相互作用网络关系,Cytoscape的MCODE插件提取关键靶基因。7.GDSC数据库分析靶基因的药物敏感性,GEPIA数据库分析关键靶基因在EC肿瘤与正常/癌旁组织的表达差异。结果1.TCGA数据库获取并对比分析284例I期EEC肿瘤组织及10例癌旁组织的mi RNA、m RNA表达水平,筛选出203个差异性表达mi RNA,其中低表达51个,高表达152个(P<0.05);差异性表达的m RNA共2587个,其中低表达1142个,高表达1445个(P<0.05)。2.单因素Cox回归分析发现在203个差异表达mi RNA中,有14个与OS相关(P<0.05),有25个与PFS相关(P<0.05)。ROC曲线显示与OS有关的单个mi RNA的3年及5年AUC值分别在0.552-0.713及0.534-0.759之间。与PFS有关的单个mi RNA的3年及5年AUC值分别在0.552-0.692及0.534-0.707之间。单个mi RNA预测OS及PFS的诊断价值均不高。3.lasso回归分析得到11个与OS有关的mi RNA组合及7个与PFS有关的mi RNA组合。多因素Cox回归分析得到OS相关mi RNA组合的风险评分公式:Score risk=(0.11119*Exphsa-mi R-1269a)+(0.25746*Exphsa-mi R-137-3p)+(0.38723*Exphsa-mi R-18b-3p)+(-0.66731*Exphsa-mi R-24-1-5p)+(0.36985*Exphsa-mi R-4758-3p)+(0.02496*Exphsa-mi R-516a-5p)+(0.10281*Exphsa-mi R-519a-5p)+(0.05564*Exphsa-mi R-522-3p)+(0.45247*Exphsa-mi R-5684)+(0.51752*Exphsa-mi R-592)+(0.21359*Exphsa-mi R-937-3p)及与PFS相关mi RNA组合的风险评分公式:Score risk=(0.07348*Exphsa-mi R-1269a)+(0.28743*Exphsa-mi R-182-3p)+(0.19775*Exphsa-mi R-18b-3p)+(-0.57537*Exphsa-mi R-3616-5p)+(0.3348*Exphsa-mi R-3691-5p)+(0.13107*Exphsa-mi R-519a-3p)+(0.23287*Exphsa-mi R-940)。根据公式计算每个EEC样本的OS及PFS风险评分。分别以OS风险评分及PFS风险评分的中位值将EEC病人分为高风险组(142例)和低风险组(142例)。4.ROC曲线结果表明,OS相关mi RNA组合的3年及5年AUC分别为0.856及0.891,高于组合内任何一个单一mi RNA的AUC值。PFS相关mi RNA组合的3年及5年AUC分别为0.762及0.81,高于组合内任何一个单一mi RNA的AUC值。两组mi RNA的生存曲线结果均提示,与低风险组相比,高风险组生存率低,预后较差(P<0.05)。5.使用mi RWalk3.0及mi RDB数据库预测并结合TCGA数据库中差异表达的m RNA,得到113个OS相关mi RNA的靶基因,115个PFS相关mi RNA的靶基因。6.KEGG通路富集表明OS相关靶基因主要富集于焦点粘连通路(Focal Adhesion)、PI3K-Akt信号通路、丝裂原激活的蛋白激酶(Mitogen-activated Protein Kinase,MAPK)信号通路、Ras信号通路、癌症途径通路(Pathway in cancer)(P<0.05)等肿瘤相关通路。PFS相关靶基因主要富集于c GMP-PKG信号通路、癌症蛋白多糖、焦点粘连(P<0.05)等肿瘤相关信号通路。使用Cytoscape软件的MCODE插件分析获得与OS相关mi RNA组合的3个关键靶基因(FLT1,HGF,FGF7)及PFS相关mi RNA组合的3个关键靶基因(TNS1,TIMP3,TPM1)。7.GDSC数据库分析发现HGF基因突变与阿霉素(Doxorubicin)、来他替尼(lestaurtinib)等药物的耐药性有关。GEPIA数据库验证了关键靶基因在EC中的表达差异。结论1.早期EEC中存在差异性表达的mi RNA。其中有14个与OS有关,3个呈低表达,11个呈高表达;有25个与PFS有关,2个呈低表达,23个呈高表达。2.11个mi RNA组合(hsa-mi R-1269a、hsa-mi R-18b-3p、hsa-mi R-4758-3p、hsa-mi R-516a-5p、hsa-mi R-519a-5p、hsa-mi R-522-3p、hsa-mi R-5684、hsa-mi R-592、hsa-mi R-937-3p、hsa-mi R-137-3p、hsa-mi R-24-1-5p)与早期EEC的OS有关,可作为预测早期EEC总生存时间的潜在分子标志物。3.7个mi RNA组合(hsa-mi R-1269a、hsa-mi R-182-3p、hsa-mi R-18b-3p、hsa-mi R-3616-5p、hsa-mi R-3691-5p、hsa-mi R-519a-3p、hsa-mi R-940)与早期EEC的PFS有关,可作为预测早期EEC无进展生存时间的潜在分子标志物。4.OS相关mi RNA及其靶基因主要与肿瘤侵袭、迁移、粘附、耐药等生物学过程有关;PFS相关mi RNA及其靶基因主要与肿瘤侵袭、转移、粘附、血管生成等生物学过程有关。