论文部分内容阅读
甲状腺癌是一种最常见的内分泌器官恶性肿瘤,占全身恶性肿瘤发病的1%左右,现已成为女性第五大常见癌症。而长链非编码RNA(lncRNAs)可作为一种竞争性内源RNAs(ceRNAs),与编码RNA通过竞争同一个miRNA反应元件(MREs)相互影响,在多种肿瘤的基因表达调控中发挥着重要作用。因此,构建三种RNAs的网络结构来研究癌症的发生机制已成为一个重要的研究方向。本文基于TCGA数据库中的表达量和临床数据,提出了一种网络构建的流程,并对差异表达的数据进行了药物预测分析。主要工作如下:1、综述了甲状腺癌现有的研究现状,总结了lncRNAs的研究进展,并对ceRNAs机制进行阐述,为本文后续研究做好理论基础。2、提出了一种基于分子网络的ceRNA识别流程(MNIceRNA)。该流程首先使用edgeR进行差异性RNA分析,然后通过miRcode数据库和WGCNA算法构建lncRNA-miRNAmRNA网络,确定正常和肿瘤样品之间差异表达RNA中的关键驱动基因(KDGs)。最后,依托lnCeDB数据库推断所识别关键驱动基因的ceRNA。结果推测得到598个lncRNAs、1025个mRNAs和90个miRNAs的差异表达基因,并将此RNAs映射到网络中得到8个关键驱动miRNA。通过ceRNA网络分析发现,与hsa-mir-375相关的ceRNAs有34个,11个ceRNAs的生存周期显著,其中RUNX2,DUSP6和SEMA3D是已知的调节甲状腺癌细胞增殖和分化的癌基因。3、提出了一种甲状腺癌相关药物或基因扰动的预测方法。构建正常样本与患病样本的两个WGCNA网络,分析得到33778个显著差异共表达基因对(P值≤1.0E-20),并基于差异表达RNAs查询药物或基因扰动表达标签,确定能够“逆转”患病子网络中表达变化的扰动项。最后,对于排名靠前的药物或基因,进行基于文献的评估或潜在机制推断。结果共得到1274个优先基因和药物靶标基因(P<0.001),并结合关键ceRNAs进行药物预测,为甲状腺癌的研究和药物开发提供依据。