论文部分内容阅读
结直肠癌(Colorectal Cancer,CRC)是一种高发病率和死亡率的恶性肿瘤,严重威胁人类的健康。本研究的目的是通过生物信息学分析并结合试验验证,寻找潜在调控结直肠癌的关键基因。首先,从基因表达综合数据库(Gene Expression Omnibus,GEO)中下载结直肠癌患者基因表达谱数据,分析在结直肠癌患者的癌组织和癌旁组织中的差异表达基因(Differentially Expressed Genes,DEGs)。其中,芯片GSE81558中存在1131个差异表达基因,GSE21510芯片中存在1837差异表达基因,GSE32323芯片中存在1507个差异基因。三个芯片所共有的综合差异基因为484个。选择这484个基因进行基因本体论(Gene Ontology,GO)分析,然后使用KEGG(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析差异基因显著富集的通路。结果表明,差异基因主要在黄酮类葡萄糖醛酸化、细胞分裂、细胞周期相变和单羧酸代谢等生物过程中显著富集;细胞组分的变化主要包括胞质的纺锤体和细胞质的核周区域的变化;氧化还原酶活性等分子功能在差异基因中显著富集。KEGG分析结果提示,差异表达基因在戊糖和葡萄糖醛酸转化,葡萄糖醛酸途径和药物代谢等代谢通路中扮演着重要的角色。为了进一步分析差异表达基因之间的相互作用,使用Metascape数据库探索蛋白质之间的互作关系,并使用MCODE算法提取其中的核心网络模块。我们从484个蛋白中主要筛选到了8个核心模块,选择最重要的MCODE1中的基因进行接下来的研究。为了验证模块基因获取的有效性,我们使用基于TCGA患者样本的多种数据库对核心模块基因进行进一步验证与分析。首先,通过最佳cut-off值对模块基因对患者的生存能力的影响进行预筛选。发现RRM2,CCNB1,MAD2L1,AHCY,BUB1B,ERCC6L,KIF18A和DSN1的基因表达异常对结直肠癌患者总生存率有显著影响。进一步验证这些基因在患者样本中的表达情况,发现这些基因在结直肠癌患者样本中显著上调。我们分析了这些基因在结直肠癌患者样本中的基因具体改变情况。在这些核心基因中,DSN1和AHCY的基因改变频率最大,而且DSN1在结肠腺癌、直肠腺癌和结肠和直肠粘液性腺癌中均具有很高的改变频率。我们选择DSN1、AHCY、ERCC6L基因,通过试验验证它们在结直肠癌细胞中的表达情况。结果显示,DSN1、AHCY、ERCC6L在结直肠癌细胞中mRNA表达显著高于正常结直肠细胞;DSN1在SW480细胞中蛋白质水平显著增加,表明DSN1可能在结直肠癌的发生发展中起到显著作用。我们针对DSN1进行基因功能的研究。使用si RNA敲减DSN1的表达,分析其对于结直肠癌细胞增殖,迁移以及集落形成能力的影响。结果显示,DSN1表达降低后,对结直肠癌细胞caco-2和SW480的细胞迁移能力和集落形成能力都有显著抑制作用,但是并没有明显抑制两种细胞的生长速度。然后,使用基因集富集分析(Gene Set Enrichment Analysis,GSEA)方法分析结直肠癌样本中DSN1基因高表达情况下显著富集的作用通路,发现在高DSN1表达的结直肠癌患者中,嘧啶代谢和核苷酸切除与修复通路相关基因显著富集。使用STRING数据库和GEPIA数据库探索DSN1在结直肠癌中发挥作用的可能机制。发现DSN1与BUB1家族的成员BUB1B之间存在紧密联系,因此,我们的研究结果显示DSN1和BUB1B之间的相互作用可能影响结直肠癌细胞的迁移能力和克隆形成能力。总之,本研究表明,生物信息学分析与试验方法验证相结合的研究方式,可以为结直肠癌的防治提供了更多潜在的重要靶点。