论文部分内容阅读
背景及目的胰腺癌(PC)是目前消化系统中高度恶性的肿瘤,严重威胁人类健康及生活质量。胰腺癌最常见的组织学类型为胰腺导管腺癌(PDAC)。近十年来,全球范围内胰腺癌发病率及死亡率未见明显改变,而在全国范围内,流行病学证据显示胰腺癌患者的发病率无明显变化,但死亡率呈上升趋势。这提示近年来对胰腺癌的分子遗传学改变认识深度仍然不足,仍缺乏可以转化为有效的临床治疗相关的潜在靶点。随着分子生物学技术的发展和生物信息学分析方法的多样化,癌症大数据被越来越多的临床研究者所熟知。这给研究胰腺癌的分子生物学本质带来了极大的便利。通过组学分析,获得胰腺癌不同研究层面的变化情况,可以加深对胰腺癌分子遗传学改变的认识。核蛋白AHNAK是体内常见大分子蛋白(分子量约629kDa),在体内发挥多种生物学功能。AHNAK参与细胞间信号转导、钙离子通道调控及细胞的黏附等多个细胞生物学过程。研究证实AHNAK在多个类型的肿瘤中存在高表达状态,并且在肿瘤中发挥多种生物学作用,在多个肿瘤中AHNAK具有重要的预后评估意义。胰腺癌最经典的形态学特征就是间质纤维结缔组织显著增生,其中最重要的细胞成分为胰腺星形细胞(PSCs),PSCs在正常情况下呈静止状态,在受到体内外因素包括肿瘤刺激时,PSCs被激活。PSCs在PDAC发生发展过程中的作用仍未完全阐明,抑制PSCs活化是否可以降低PDAC的恶性潜能仍未可知。甲基化是目前最常见的表观遗传学修饰方式。研究证实了甲基化可以影响多个肿瘤的发生及进展。但是胰腺癌中的甲基化情况及作用并未全部明确,PSCs的甲基化情况及其临床作用少有人报道。因此,本研究通过生物信息学对胰腺癌公共数据进行分析,使用经典的分子生物学实验对预测结果进行验证,以期可以找到新的胰腺癌诊断或治疗相关的新靶点。在此基础上,本研究针对PDAC的形态学特征,通过分离培养获得PDAC中的活化PSCs,使用全反式维甲酸(ATRA)处理去活化后进行全基因组甲基化测序(WGBS)检测,以期明确PSCs活化过程中的甲基化改变,进一步理解PSCs在PDAC发生发展中的作用。方法一、使用生物信息学分析对网络公共胰腺癌高通量数据进行归纳整理。下载Gene Expression Omnibus(GEO)数据库和 The Cancer Genome Atlas(TCGA)数据库中胰腺癌高通量遗传学数据及临床预后相关信息,首先使用R语言对GEO数据库中的PDAC芯片高通量数据进行标准化后,通过差异分析、聚类分析获得差异表达基因(DEGs)(logFC>2,P<0.05),使用 RobustRankAggreg(RRA)整合得到GEO芯片中共同的DEGs;使用GO、KEGG和GSEA分析得到整合DEGs参与的相关生物学功能及信号通路;使用STRING数据库分析整合DEGs的蛋白-蛋白相互作用(PPI);使用Kaplan-Meier对DEGs进行预后分析,获得具有预后预测功能的DEGs。二、使用驱动基因预测网站IntoGen获得胰腺癌相关的驱动基因,并且降低胰腺癌中DEGs的筛选条件以扩大获取的胰腺癌中DEGs的范围(logFC>0.5,P<0.05)。联合分析得到在胰腺癌中表达差异且发挥重要功能的驱动基因。三、结合生物信息学预测结果及文献报道,我们得到AHNAK在PDAC中具有表达差异并且与预后相关。因此,我们使用经典的分子生物学方法对AHNAK的功能进行了验证。首先纳入包含临床及预后数据的66例胰腺癌石蜡样本进行免疫组织化学染色(IHC),使用卡方检验及t检验分析AHNAK与PDAC临床病理数据之间的关系,然后明确AHNAK表达水平与PDAC患者的预后明确相关。使用qRT-PCR及Western blot等分子生物学实验在胰腺癌细胞系中对AHNAK相关的功能和信号通路进行分析,使用细胞学功能实验明确AHNAK参与的细胞功能;同时使用生物信息学方法GSEA,GO和KEGG分析对结果进行佐证。四、由于胰腺癌的组织特殊性,肿瘤主要由间质成分组成,而胰腺星形细胞(PSC)是胰腺癌间质最主要的成分。免疫组化发现在胰腺星形细胞中也可以高表达AHNAK,因此使用统计学方法明确PSCs中AHNAK的表达情况及其在PDAC中的临床意义。结合文献PSCs活化可以促进PDAC的进展,因此我们使用高通量测序方法—WGBS对PSCs进行检测,同时联合本实验室前期获得的PSCs转录组数据进行了进一步分析,进一步理解PSCs在PDAC发生发展中的作用。结果一、生物信息学获得的116对胰腺癌及正常对照样本中,共发现12个共同上调(POSTN、ITGA2、FN1、CEACAM5、LAMC2、SLC6A14、TSPAN1、CEACAM6、GALNT5、CTSE、C1S 和 LAMB3)和 6 个共同下调 DEGs(IAPP、RN7SL186P、ALB、SERPINI2、RNU6-570P、CTRL);GO 和 KEGG 分析发现这些 DEGs 主要参与细胞外基质的形成及分泌、细胞间相互作用等生物学功能;PPI分析发现DEGs之间存在密切的相互作用;预后分析发现LAMB3,LAMC2,SLC6A14,ITGA2,和C1S对胰腺癌预后具有评估作用;二、驱动基因预测发现胰腺癌中存在20个驱动基因,与扩大范围的DEGs取交集得到5个驱动基因存在表达差异(ARID、AHNAK、ATM、PCDH18和EPC1),结合文献我们选择AHNAK作为研究分子,使用IHC验证AHNAK在PDAC中表达高于癌旁正常对照,并且AHNAK高表达与PDAC患者的生存期(OS)及无病生存期(DFS)缩短相关,AHNAK是PDAC预后的独立预测因素。三、分子生物学实验证实AHNAK可以通过调控多条信号通路(IL2/STAT5信号通路、TP53信号通路)改变胰腺癌细胞(PCCs)的上皮间质转化(EMT)过程进而促进PCCs的增殖的迁移能力,但并未影响PCCs的凋亡情况。四、IHC证实PSCs中高表达AHNAK也与PDAC患者预后较差相关。TCGA数据库中胰腺癌AHNAK低甲基化也与预后较差相关。结合本实验室之前的研究,我们使用ATRA处理去活化PSCs后,进行WGBS检测,结果发现,在PSCs活化过程中甲基化水平发生改变。基因组水平去活化PSCs的mCpG水平较活化PSCs更高(59.61%vs.48.8%),去活化 PSCs 的 mCpG 占比相对较低(79.39%vs.92.40%);Motif的甲基化模式也有不同;活化PSCs和去活化PSCs间不同基因功能区域的mCG、mCHG和mCHH之间存在较细微的差异;染色体水平也显示去活化PSCs具有更高的甲基化水平。五、全基因组甲基化水平差异区域(DMR)显示活化PSCs和去活化PSCs存在大量的DMRs,其中174个DMRs同时包括三种甲基化模式(CG,CHG和CHH);启动子区有44个DMR同时包含CG,CHG和CHH三种甲基化模式;GO分析发现全基因组DMRs主要富集于发育相关的生物学功能,启动子区DMRs主要富集于细胞器及细胞内相关功能;KEGG分析发现DMRs主要参与了多条肿瘤相关信号通路,如 Hippo signaling pathway(hsa043 90)、Pathway in cancer(hsa05200)、Rap 1 signaling pathway(hsa04015)、Hedgehog signaling pathway(hsa04340)和 Wnt signaling pathway(hsa04310)。六、联合转录组数据我们得到20个差异基因,并选择差异最明显的CARMIL3和MED12L进行验证,甲基化特异PCR(MSP)和qRT-PCR证实CARMIL3和MED12L证实了 WGBS的结果。然后使用GO和KEGG分析证实这些基因主要参与多态性(ploymorphism)、序列变异(sequence variant)等相关功能。结论一、胰腺癌中存在大量DEGs,并且主要参与细胞外基质的形成及分泌、细胞间相互作用等生物学功能;其中LAMB3,LAMC2,SLC6A14,ITGA2,和C1S与胰腺癌患者的预后明确相关;二、胰腺癌驱动基因AHNAK可以通过参与多条信号通路(IL2/STAT5信号通路、TP53信号通路)调控胰腺癌细胞(PCCs)的上皮间质转化(EMT)过程进而促进PCCs的增殖的迁移能力,进而与PDAC患者的预后相关;三、胰腺癌促进PSCs活化过程中,PSC基因组甲基化水平发生改变并且参与了胰腺癌中多个生物学功能及信号通路。