论文部分内容阅读
目的:2型糖尿病(Type 2 diabetes mellitus,T2DM)在世界各地流行,俨然已成为严重的公共卫生负担之一,亟待解决。空腹血糖(Fasting blood glucose,FBG)作为T2DM诊断的重要实验室检测指标,处于较高水平时即使低于T2DM诊断阈值也会增加人群发病率和死亡率。T2DM的发生和发展与脱氧核糖核酸(Deoxyribonucleic acid,DNA)甲基化相关联,但T2DM和DNA甲基化均受到遗传因素、环境因素以及随机效应共同作用的影响,因此,关于DNA甲基化与T2DM或血糖代谢指标之间的研究发现受到了一定的限制。疾病/性状不一致的同卵(Monozygotic,MZ)双生子具有相同的基因组序列和早期生活环境,应用于机制复杂疾病的DNA甲基化研究可以消除这些因素所带来的混杂效应,提高统计分析的把握度。此外,在基于横截面设计的表观遗传学研究中,MZ双生子的使用也使因果推断成为可能。据此,本研究基于FBG水平不一致的MZ双生子样本,开展全基因组DNA甲基化分析,系统探索与T2DM发生发展相关的DNA甲基化位点,挖掘与T2DM相关的差异性甲基化区域(Differentially methylated regions,DMRs),识别与T2DM相关的基因,筛选与T2DM相关的生物学信号通路,并探索单个DNA甲基化位点与FBG之间的因果关联。此外,我们还基于双生子基因表达谱数据对差异性甲基化结果进行验证。方法:从青岛市双生子登记系统获取研究对象,并完成知情同意书的签署。FBG水平采用葡萄糖氧化酶法和半自动分析仪(Hitachi 7600,Japan)检测。MZ研究对象经10-12小时的禁食后,抽取肘部静脉血,并通过性别差异性、ABO血型差异性及短串联重复序列DNA标记技术逐步对卵型进行鉴定。采用简化代表性亚硫酸氢盐测序技术完成DNA甲基化谱的测序。采用Re FACTor软件校正细胞类型异质性。基因表达谱的测序采用二代测序技术完成。采用R软件拟合广义估计方程(Generalized estimating equations,GEE)以分析单个胞嘧啶-磷酸-鸟嘌呤(Cytosine phosphate guanine,Cp Gs)的DNA甲基化水平与FBG水平的关系。该GEE模型调整了年龄、性别、舒张压、细胞类型成分以及双生子对编号等协变量。采用R语言包bioma Rt将基因组相应的Cp Gs注释到最近的基因上。采用基因组区域富集注释工具(Genomic regions enrichment of annotations tool,GREAT)在线分析可能与FBG相关的基因富集区域和生物学功能。通过comb-p工具鉴定与FBG相关的DMRs。采用ICE FALCON(Inference about causation through examination of familial confounding)方法推断单个Cp Gs与FBG之间的因果关系。采用加权基因相关网络分析(Weighted gene correlation network analysis,WGCNA)基于基因表达谱数据探索与FBG有关的差异表达基因,并采用DAVID工具探索与FBG的相关生物学功能与通路。最后将之与DNA甲基化分析的结果进行比较与整合,以对关键差异甲基化基因和生物学功能与通路进行验证。结果:本研究共纳入52对FBG水平不一致MZ双生子,其中男性27对,女性25对。双生子的平均年龄是52.12±7.44岁,FBG的中位数和95%百分位数分别为5.44(3.76,7.40)mmol/L。(1)基于单个Cp G的分析,我们鉴定出30个P值<1×10-6的Cp Gs,其中12个Cp Gs的P值小于1×10-7。P值小于1×10-6的Cp Gs被注释于17个基因,其中有4、2、3、2、5、2、2个Cp Gs分别位于/邻近TLCD1、SYNPO、MZF1、PTPRN2、SLC6A18、ASTN2和IQCA1。剩余10个Cp Gs分别位于/邻近10个基因,如ALDH1L2、RNF126、PPP2R2A、LAMC3、ENSG00000270492(相应的基因名称未查到)、LINC02064、FAM175B、GRIN1、LONRF2P1以及PDE2A。GREAT分析发现一些与FBG相关的通路,比如序列特异性DNA结合通路、丝裂原活化蛋白激酶p38结合通路、金属离子结合通路、胰岛素受体信号通路、细胞命运调控通路以及生物合成过程调节通路等。基于甲基化区域分析,确定了32个与FBG相关的DMRs,其中共有18个DMRs的DNA甲基化与FBG呈正相关,12个DMRs的DNA甲基化与FBG呈负相关,其余2个DMRs的DNA甲基化与FBG的相关性难以确定。这些DMRs位于/邻近24个基因,值得注意的是,4个DMRs覆盖了基于单个Cp G的分析中所发现的P值小于1×10-6的Cp Gs。(2)通过因果推断分析发现,在满足P<1×10-6的Cp Gs中,7个Cp Gs的DNA甲基化(位于/邻近SLC6A18、IQCA1以及PDE2A)与FBG互为因果,即FBG随着Cp Gs的DNA甲基化水平的变化而改变,反之亦然。而8个Cp Gs的DNA甲基化改变(位于/邻近MZF1、PTPRN2、ENSG00000270492、GRIN1以及SLC6A18)导致FBG的改变。FBG改变导致5个Cp Gs发生DNA甲基化变化(位于/邻近TLCD1和ASTN2)。其余Cp Gs的DNA甲基化水平与FBG之间的因果推断并无统计学意义。(3)基于12对FBG水平不一致MZ双生子亚样本,WGCNA算法划分出19个基因共表达网络模块。其中,Darkolivergreen模块(共721个基因聚集)与FBG(r=0.61,P=0.001)具有最显著的正相关关系。根据层次聚类树状图显示,Darkolivergreen模块与FBG位于相同分支内。同时,相关性热图和相关性散点图分析也显示,Darkolivergreen模块与FBG相关。此外,我们从Darkolivergreen模块中筛选出了85个与FBG相关的关键枢纽基因。DAVID富集分析基于Darkolivergreen模块基因探索了一些与FBG相关的关键生物学通路,如G蛋白偶联受体信号通路、嗅觉传导通路、神经肽信号通路、多巴胺结合通路、视黄醇代谢通路、细胞命运调控通路以及钙离子结合通路等。(4)基于单个Cp G的分析,P值<1×10-4的Cp Gs被注释到了123个基因,其中有78个基因被基因表达谱分析验证。而有18个基因如ALDH1L2、TLCD1、RNF126、SYNPO、MZF1、PTPRN2、PPP2R2A、SLC6A18、ASTN2、LAMC3、IQCA1、FAM175B、GRIN1、PDE2A、MRPL23、CASZ1、GON4L以及CSNK1E也被P值<1×10-6的Cp Gs和/或DMRs所注释。在以上被验证的基因中,ICE FALCON方法鉴定了其中8个基因的一些Cp Gs(P值<1×10-6)的DNA甲基化与FBG之间存在因果关系,包括TLCD1、MZF1、PTPRN2、SLC6A18、ASTN2、IQCA1、GRIN1以及PDE2A。此外,在DNA甲基化分析和基因表达谱分析中,我们还发现了11条共同的富集通路,比如多巴胺结合通路、生物合成过程调节通路、神经元命运通路以及细胞命运调控通路等。结论:本研究发现了多个可能与FBG相关的Cp Gs位点、DMRs、基因及通路,将为进一步阐明人群T2DM的发病机制提供重要线索。