论文部分内容阅读
研究背景肝癌是我国第二大肿瘤死因。随着老龄化和环境危险因素暴露增加,肝癌发病率居高不下。男性高发是肝癌一个重要流行病学特点。据估计,我国男性肝癌发病率约是女性3倍。生活方式如饮酒、吸烟等不足以解释所有的男性肝癌发病风险。饮酒、乙型肝炎病毒(Hepatitis B Virus,HBV)、性激素受体以及它们之间的交互作用可能是男性肝癌高发的原因。性激素受体被认为明确与肝癌发生有关。目前认为,雄激素受体(Androgen Receptor,AR)发挥促癌作用,雌激素受体(Estrogen Receptor,ER)发挥抑癌作用。HBV可能与性激素受体相互作用,共同促进肝癌发展。饮酒与HBV的交互作用也会增加HBV的致癌能力。目前在肝癌发病性别差异上的研究主要集中在两方面:第一,探究男性肝癌高发人群特征以及肝癌男性高发相关危险因素。第二,利用分子生物学手段研究某一特定分子和通路在男性肝癌高发中的作用。目前,尚没有研究对男性肝癌高发原因进行整体描述和分析。我们利用生物信息学的手段,全面描述男性肝癌的基因特异性表达模式,分析其与预后的关系,并预测可能调控机制。研究目的根据转录组学分析男性肝癌基因特异性表达模式。从表观修饰、微小RNA(micro RNA,miRNA)和性激素受体角度预测男性肝癌基因特异性表达模式的调控机制。通过生存分析,探索男性特异性表达模式的临床价值,构建男性肝癌预后模型。研究方法1.数据来源:本研究数据来源于癌症和肿瘤基因图谱计划(The Cancer Genome Atlas,TCGA)公共数据库中肝癌相关的RNA-seq、miRNA、甲基化数据和临床数据。本研究验证数据来源于本教研室收集并测序的男性肝癌患者癌症与癌旁组织的RNAseq数据。2.样本纳入:采用频数配对法和倾向评分匹配的方法进行样本纳入筛选。首先保证肝癌和癌旁组织中病毒感染信息匹配。其次,根据年龄、肝癌病理分期、身体质量指数(Body Mass Index,BMI)等进行倾向评分匹配。3.本研究将肝癌性别特异性基因或表达模式定义为:1)存在性别差异的基因或表达模式,即某一性别基因或表达模式相对于另一个性别存在高、低表达;2)与肝癌有关的基因或表达模式,即排除正常人中与性别有关,与肝癌无关的基因或表达模式。4.在肝癌、癌旁组织中进行基因差异表达分析,筛选出男性特异性高、低表达基因和女性特异性高、低表达基因,并对差异基因进行功能富集分析。5.利用生存分析,探究男性特异性基因富集通路与肝癌患者预后的关系。6.利用验证集数据对男性特异性差异表达基因、富集通路的表达水平、富集通路与肝癌预后的关系进行验证。7.采用Spike-and-Slab Lasso Cox模型,构建基于男性特异性差异表达基因的男性肿瘤风险预后模型。8.在肝癌和癌旁组织中进行miRNA差异表达分析,筛选出男性特异高、低表达miRNA,女性特异性高、低表达miRNA。利用TARGETSCAN和miRANDA数据库预测miRNA靶基因。并将靶基因与差异表达基因相结合,寻找miRNA和基因相互作用关系。9.利用加权基因共表达网络(Weighted Gene Co-Expression Network Analysis,WGCNA)寻找男性中具有类似表达模式的模块(module)。对模块内基因进行富集分析,确定模块相关功能。构建共表达网络,筛选模块中处于核心地位的基因。10.对纳入样本的甲基化数据进行分析,筛选男性差异甲基化位点和甲基化区域。结合差异表达基因,探究甲基化在男性肝癌中的作用。11.根据AR和ER转录因子识别模体预测其可能参与调控的靶基因。利用DNaseseq数据探究AR和ER的可能调控靶基因的染色质可接近性。筛选具有可接近性的、可能被AR、ER调控的基因,探究AR、ER在男性肿瘤高发中可能发挥的作用。研究结果1.在基因差异表达分析中共筛选出男性特异性高表达基因633个,男性特异性低表达基因852个;女性特异性高表达基因713个,女性特异性低表达基因339个。基因富集分析结果显示男性特异性高表达基因富集在核蛋白复合体形成、非编码RNA、核糖体形成、细胞热反应通路上。男性特异性低表达基因富集于免疫相关通路中。女性特异性高表达基因富集通路与细胞形态、跨膜转运有关。女性特异性低表达基因未富集在任何通路上。2.男性特异性基因表达模式与男性肝癌患者预后有关。男性特异性低表达基因富集通路整体表达水平低,患者预后差;男性特异性高表达基因富集通路整体表达水平高,患者预后差。3.Spike-and-Slab Lasso Cox模型中共纳入29个基因,其中男性特异性低表达基因9个,男性特异性高表达基因20个。该模型可以较好预测男性肝癌患者预后。4.通过miRNA差异表达分析,共筛选出34个男性特异性高表达miRNA,34个男性特异低表达miRNA。18个miRNA与男性特异性差异表达基因存在相互作用关系,其中14个为男性特异性高表达miRNA。根据miRNA靶基因预测,481个男性肝癌特异性差异表达基因被miRNA调节。其中322个为男性特异性低表达基因,这些基因富集于免疫相关通路。5.加权基因共表达网络分析发现12个模块,免疫相关模块与RNA相关模块、甲基化模块、类固醇激素代谢模块呈负相关关系。6.甲基化芯片分析共检测出174551个差异甲基化位点,33444个位点位于启动子区。启动子区甲基化位点数≥3的基因中包含大量miRNA、lincRNA。本研究共检测出1506个差异甲基化区域。甲基化区域包含了97个男性特异性低表达基因,其中一部分为免疫相关基因。7.男性差异表达基因中有157个可能受到AR调控,其中80个具有可接近性。男性差异表达基因中有72个可能受到ER调控,其中40个具有可接近性。AR和ER调控的靶基因与RNA的形成与修饰有关。研究结论1、免疫抑制是男性肝癌基因特异性表达模式。2、男性特异性表达基因富集通路与患者预后相关,男性特异性差异基因可以用于男性肝癌预后模型构建。3、miRNA可能通过降低免疫相关基因的表达,引起男性肝癌免疫抑制。4、甲基化可以通过参与RNA形成和修饰过程间接调节免疫功能,也可以通过DNA甲基化直接调节免疫功能。5、AR和ER作为转录因子可能通过参与RNA形成与修饰过程,进而调节男性特异性肝癌基因的表达。