论文部分内容阅读
研究背景前列腺癌在未来十年仍然是一个重大的全球健康负担。尽管大部分早期前列腺癌患者的五年生存率较为乐观,但远处转移的晚期前列腺癌患者的生存率仍有待提高。多项研究表明,癌细胞的治疗耐药性和转移性进展与其周围的肿瘤微环境显著相关。前列腺癌是一种具有高度免疫抑制微环境的实体恶性肿瘤。因此,与肿瘤微环境动态调节相关的分子事件对于筛选前列腺癌的预后生物标志物很有价值。竞争性内源性RNA(competitive endogenous RNA,ceRNA)是指复杂转录调控网络中的RNA,包括信使RNA(messenger RNA,mRNA)、转录假基因、环状 RNA 和长链非编码 RNA(long-chain noncoding RNA,lncRNA)。ceRNA假说表明,这些RNA可以通过竞争微小RNA(micro RNA,miRNA)的miRNA反应元件(miRNA response elements,MRE)来相互调节。ceRNA网络中的相互作用调节了癌症的基本生物学过程,这表明ceRNA具有作为癌症诊断和预后生物标志物的可能性。加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)是一种用于寻找共表达基因模块的分析方法,可探索基因网络与感兴趣的表型之间的关系,同时可以聚焦网络中的核心基因。WGCNA的优势在于可以将高度相关的基因识别并聚类到同一个模块中,并提供相关模块的外部临床特征,这对识别潜在的生物标志物非常有帮助。目的使用癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库研究前列腺癌微环境相关的预后生物标志物和关键的ceRNA通路,为未来的研究提供新的诊断方法和思路。方法1、从TCGA数据库中下载基因表达数据谱及临床指标,按筛选标准进行样本筛选,最终462例具有lncRNA、miRNA和mRNA数据的前列腺癌病例被纳入进一步分析。2、使用表达数据估计恶性肿瘤中的基质和免疫细胞(Estimation of stromal and immune cells in malignant tumors using expression data,ESTIMATE)分析方法,从TCGA数据库中获得的前列腺癌基因表达数据谱进行基质评分(Stromal score,SS)和免疫评分(Immune score,IS),使用R语言分析基于SS和IS的差异表达的mRNA、lncRNA和miRNA。3、上述筛选出的差异表达的mRNA、lncRNA、miRNA的表达谱,通过使用R语言进行WGCNA,构建了 lncRNA/mRNA共表达网络和miRNA共表达网络。4、用模块特征基因(Module eigengene,ME)来代表每个特定模块中的所有基因,并执行Pearson相关性检验来分析共表达基因模块与临床特征之间的关联。5、进行了基因本体论(Gene ontology,GO)和京都基因和基因组百科全书(Kyoto encyclopedia of genes and genome,KEGG)功能富集分析,来进一步探究其分子机制。6、结合lncRNA、mRNA和miRNA的数量与模块与性状的相关性,选择关键的lncRNA/mRNA和miRNA共表达模块来构建ceRNA网络。使用miRanda、Targetscan、miRWalk 和 PITA 数据库对 miRNA-mRNA、lncRNA-miRNA 进行预测,将预测结果与配对模块间的关系对取交集,得到最终miRNA-mRNA和lncRNA-miRNA 关系对,使用 Cytoscape 3.7.0 软件构建所需的 ceRNA(lncRNA-miRNA-mRNA)调控网络。7、将在上述确定的关键模块中包含的所有mRNA、lncRNA和miRNA进行无复发生存时间(Relapse free survival,RFS)生存分析,并绘制Kaplan-Meier曲线。8、通过功能通路富集分析、ceRNA网络分析和生存分析确定关键生物标志物。结果1、从TCGA数据库中共获取了 462个前列腺癌样本用于进一步分析。IS组评分间差异表达有781个mRNA、237个lncRNA、60个miRNA;SS组评分间差异表达有765个mRNA、207个lncRNA、116个miRNA。2、经过WGCNA预分析后,以SS组作为后续分析的数据。最终确定了lncRNA/mRNA和miRNA共表达网络分析的β值分别为4和9,共表达网络中分别产生了 10个和5个模块。选择绿松石色、蓝色和棕色lncRNA/mRNA模块以及绿松石色和蓝色的miRNA模块作为关键模块来进行下一步的ceRNA网络分析。3、关键模块的GO功能分析,主要富集在信号转导、细胞粘附、细胞分化和几个代谢相关过程等,KEGG通路主要富集在癌症通路、代谢途径、PI3K-Akt信号通路和MAPK信号通路等。4、基于已确定的关键模块,根据模块间lncRNA/mRNA与miRNA的正负相关性,可构建三种组合的ceRNA网络,第1组包括45个mRNA、18个lncRNA和24个miRNA;第2组包括16个mRNA、15个lncRNA和12个miRNA;第3组包括9个mRNA、6个lncRNA和7个miRNA。5、生存分析发现8个lncRNA、3个miRNA和20个mRNA的表达水平与RFS显著相关。6、通过功能通路分析、ceRNA网络分析和生存分析确定了 9个关键生物标志物(LINC01082、SNHG25、hsa-miR-13 3a-3p、hsa-miR-133b、ARSD、CRISPLD2、PGM5、RASL12、SH3BGRL),发现了 LINC01082/miR-182-5P/CRISPLD2 轴和LINC01082/miR-182-5P/SH3BGRL轴可能在前列腺癌发生发展中具有重要作用。结论1、构建了 3个与肿瘤微环境有关的前列腺癌的ceRNA网络,确定了 9个关键的生物标志物 LINC01082、SNHG25、hsa-miR-133a-3p、hsa-miR-133b、ARSD、CRISPLD2、PGM5、RASL12、SH3BGRL,可以为未来的临床治疗和科学研究提供新的方法和思路。2、通过分析关键RNA相互作用的ceRNA网络关系,发现了LINC01082/miR-182-5P/CRISPLD2 轴和 LINC01082/miR-182-5P/SH3BGRL 轴可能在前列腺癌发生发展中具有重要作用。