论文部分内容阅读
目的:长非编码RNA(long non-coding RNA,lncRNA)可以竞争性结合内源性miRNA,从而诱导miRNA靶基因表达上调。这类细胞内竞争性结合miRNA的RNA也被称作竞争性内源性RNA(competing endogenous RNA,ceRNA)。目前,研究已发现ceRNA在肝硬化的发生发展中起着重要作用。尽管肝硬化存在较大的癌变风险,但尚无研究系统化构建肝硬化癌变相关ceRNA网络。本研究拟利用基因表达谱数据,构建肝硬化癌变相关的ceRNA网络,挖掘网络中的关键基因。方法:在Gene Expression Omnibus(GEO)数据中,获取肝硬化-肝细胞性肝癌各阶段组织的基因芯片数据,利用芯片探针重注释的方法,构建lncRNA-mRNA双相表达矩阵。然后,利用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)将基因根据表达水平上的相关性分成不同的基因集模块(module)。在与肝硬化癌变显著相关的模块中,分别构建ceRNA网络。将WGCNA与ceRNA网络分析中共同的枢纽基因(hub gene),作为肝硬化癌变相关的关键基因。另选取新的数据集,验证关键基因在肝硬化和肝癌中的差异表达情况以及在肝癌中的预后情况。最后,选取一个关键基因,进行分子生物学验证。结果:65例肝组织样本涵盖了肝硬化-肝细胞性肝癌7个阶段,对其lncRNA-mRNA表达数据进行WGCNA分析,发现4个模块与肝硬化癌变显著相关(R~2>0.7,P<0.05)。在显著性模块内部分别构建ceRNA网络,将WGCNA与ceRNA网络分析中11个共同的枢纽基因作为关键基因。其中,8个基因表达水平与肝硬化癌变正相关(ASPM,CCNB1,CDC6,CDC23,EIF3H,EXO1,RAD21,TOP2A),3个基因与肝硬化癌变负相关(CXCL12,DCN,HGF)。验证集中(N=37),与肝硬化相比,7个关键基因在肝癌组织中高表达(ASPM,CCNB1,CDC6,CDC23,EIF3H,EXO1,TOP2A)(P<0.05),3个基因在肝癌中低表达(CXCL12,DCN,HGF)(P<0.05),而RAD21在肝癌中表达变化不明显(P>0.05)。由2个关键基因构建的诊断模型,在肝硬化和肝癌中具有较高的鉴别诊断价值(area under ROC curve(AUC)=0.821)。肝癌预后中,6个关键基因高表达提示预后较差(ASPM,CCNB1,CDC6,CDC23,EIF3H,EXO1,TOP2A)(P<0.05),CXCL12和DCN高表达提示预后较好(P<0.05),RAD21高表达提示3年生存率较低(P<0.05),HGF高表达提示3年生存率较高(P<0.05)。由11个关键基因构建的预后模型,具有较高的预测价值(concordance index(C-index):0.683,95%CI:0.628~0.738)和稳定性(组间P=0.640)。选取ASPM进行分子生物学验证,发现在四氯化碳诱导的大鼠肝纤维化模型中,ASPM表达量与肝组织纤维化程度显著相关(P=0.042)。肝癌细胞系7721和M9中,ASPM沉默后,细胞增殖能力、克隆形成能力、迁移和侵袭能力均明显降低(P<0.05),细胞凋亡率明显增高(P<0.05)。肝星状细胞LX2中,ASPM沉默后,α-SMA和COL1A1表达水平明显降低(P<0.05),细胞凋亡率明显增高(P<0.05)。结论:本研究首次使用两种不同的生物网络分析方法,构建了肝硬化癌变相关的ceRNA网络,并挖掘了网络中11个关键基因。数据集验证和分子生物学验证均证实了研究方法和结果的可靠性。