基于多组学数据的代谢综合征及代谢组分相关遗传变异的探索和解析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:cppgreate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢综合征是一组代谢指标异常症候群,主要表现为中心性肥胖、高血压和糖脂代谢紊乱。研究表明,代谢综合征会增加心脑血管疾病、糖尿病的发病风险。按中国糖尿病协会定义,2010年我国居民代谢综合征患病率达17.6%。双生子研究表明,遗传因素在代谢异常的发生中起了重要的作用。经典的全基因组关联研究(genome-wide association study,GWAS)已发现了一些与代谢异常相关的遗传变异,但仍存在以下两大问题:(1)已发现的位点仅能解释少量的遗传度,即存在大量丢失的遗传度(missing heritability)有待进一步探究;(2)以往研究主要关注表型相关的标签SNP(tag SNP)及与之距离最近的基因,但后续研究发现,大部分的定位信号并不通过与之距离最近的基因起作用,如现已证明,定位在FTO上的肥胖相关位点主要通过远程调控IRX3基因表达影响表型。总之,以往对GWAS定位信号的解析非常有限,多数关键基因和效应位点(causal variant)未被找到,不利于后续功能研究。近些年研究发现,大部分表型相关遗传变异通过调控基因表达水平进而影响表型。若以基因表达调控作为注释,可以将全基因组的筛选范围缩小到基因表达数量性状基因座(expression Quantitative Trait Loci,eQTLs)上,提高发现表型相关位点的效率。ENCODE、GTEx、Roadmap等研究项目陆续公布了大量可用于注释遗传变异对表型调控路径中多个组学的信息,包括具有组织特异性的基因表达、DNA甲基化、组蛋白修饰、转录因子结合等。这些信息可用于进一步精确筛选表型相关遗传变异,也可用于对已知信号的重新解析。以往的研究主要以欧裔人群为主,在我国汉族人群中的研究还很有限,由于不同人种间存在遗传背景的差异,欧裔人群的研究结果不能直接外推至中国汉族人群。为了系统地探索代谢综合征及代谢组分相关的遗传易感位点,本研究以我国汉族人群为主要研究对象,通过基于多组学注释的全基因组关联分析,发现并解析代谢异常相关的遗传变异。研究内容分为三个部分(图1):第一部分采用经典的全基因组关联分析策略,筛选与代谢综合征及代谢组分关联信号最强的遗传变异位点并进行多阶段验证、功能分析和基因环境交互效应分析。第二部分在第一部分研究的基础上,通过对转录调控的注释,进一步筛选与糖脂代谢相关的遗传变异,通过精细定位和功能实验,解析基本调控路径。第三部分针对已知的糖脂代谢关联信号,利用最新的多组学注释信息对信号区域进行系统化的重解析,探究关键的调控基因,为关联分析的成果转化提供支持。图1研究内容示意图左上侧图为课题组开展的代谢综合征GWAS关联信号(P值)的曼哈顿图,图下左侧为第一部分技术路线,右侧为第二部分技术路线。右侧图为NHGRI-EBI GWAS catalog记录的表型相关的位点,为研究的第三部分,采用多组学注释,对与代谢异常相关的位点进行系统化重解析。第一部分代谢综合征的遗传易感性研究一、研究目的:在中国汉族人群中筛选并验证代谢综合征相关的遗传易感性位点。二、材料和方法:以单核苷酸多态性位点为遗传变异标记,首先在杭州萧山地区1742例样本中采用全基因组关联分析的方法,筛选出与代谢综合征及代谢组分关联信号最强的位点,然后对这些位点进行多阶段独立样本验证,验证样本来自我国东部、北部、东北部等多个地区,共计10978例。合并多阶段验证结果后,对达到全基因组阳性水平的位点进行功能预测、基因环境交互效应分析。三、研究结果:通过代谢综合征的全基因组关联分析及多阶段独立样本的验证,研究发现位于APO45上的rs651821位点和位于ADF2上亚洲人特有的高频错义突变位点rs671的基因型与代谢综合征的遗传易感性相关。在控制了 APO4基因簇区域内最强信号rs651821后,位于BUD13上的rs180326位点仍然与血清甘油三酯(triglyceride,TG)水平相关(Pconbined=2.4E-08),是APO4基因簇内一个新的第二信号(secondary signal)。在整合了 遗传变异位点 rs651821、rsl80326、血清 APOA5、BUD13的蛋白水平、TG水平后分析发现,除了APO外,BUD13也参与了血清TG水平的调控。此外,研究发现rs671位点的多态性不仅会通过影响乙醛代谢影响人们的饮酒行为,该位点还与饮酒行为之间存在对代谢综合征及相关代谢表型的交互效应,其效应主要存在于饮酒人群中。四、小结:(1)在中国汉族人群中,rs651821(APOA5)和rs671(ALH2)位点的基因型与代谢综合征的遗传易感性相关;(2)rs180326(BUD13)基因型与血清TG水平相关,其效应独立于已知位点rs651821(APOA5);(3)rs671(ALDH2)的基因型与饮酒行为存在交互效应。第二部分基于注释信息的糖脂代谢相关遗传变异筛选及精细定位一、研究目的:在第一部分研究的基础上,结合多组学注释信息,进一步筛选和验证糖脂代谢指标相关的遗传变异位点;对新发现的糖脂代谢相关遗传变异位点进行精细定位,并通过功能实验确认效应位点。二、材料和方法:首先,通过对1742例样本(同第一部分)的糖脂代谢的全基因组关联分析,得到与表型相关的但又未被第一部分验证过的遗传变异位点;然后分析这些位点与脂肪、肝脏、胰岛和骨骼肌中基因表达水平的关联,并将这些位点的信号与表型关联信号共定位,找出与糖脂代谢表型相关的eQTLs;进一步通过多阶段独立样本验证基因型与表型的关联;对验证达到全基因组阳性水平的位点,通过以基因为单位的分析策略(gene-based analyses)推测其可能的调控基因;并通过ENCODE和Roadmap计划提供的相关组织细胞中染色质状态、组蛋白修饰、转录因子结合信号推测调控活性区域及其对应的效应位点;最后构建包含不同等位基因的载体,通过荧光素酶报告基因实验确认其表达调控作用。三、研究结果:通过全基因组关联分析及eQTL的注释,发现了 22个与糖脂代谢相关的遗传变异位点在特定的组织中影响基因表达,多阶段独立样本验证确认了 rsl880118位点与血清HDL-C水平的关联(Pcombined= 1.4E-10)。该位点可以tag的区域主要包括DAGLB和RAC1两个基因,在加性模型下,rsl880118的基因型可以解释DAGLB(diacylglycerol lipase,beta)基因在皮下脂肪组织中表达水平变异的47.7%(P =5.9E-42)。同时,通过TWAS、SMR、Sherlock等以基因为单位的研究方法,我们发现D4GLB基因与血清HDL-C水平之间存在关联,关联的P值分别为3.0E-08、1.1E-04和1.6E-06。进一步通过组蛋白信号H3K27ac、H3K4me3,H3K9ac及转录因子结合区域、DNA酶Ⅰ超敏位点的定位,找到了位于DAGLB基因5’区域的调控活性片段,荧光素酶报告基因的结果显示,该活性片段中rs4724806位点(与rs1880118位点LD r2 = 0.77)可能是真正的效应位点,其最小等位基因会增加转录活性,与eQTL分析的结果一致。四、小结:rsl880118是一个在中国汉族人群中新发现的与血清HDL-C水平相关的遗传变异位点,其效应位点rs4724806通过调控转录活性影响DAGLB基因表达,该部分研究提示了 A4GLB基因在脂代谢中的作用。第三部分利用多组学注释系统解析糖脂代谢相关的遗传变异一、研究目的:结合多组学注释信息,对已知的糖脂代谢相关遗传变异信号区域进行系统的解析,探究基因型到表型的调控路径,为后续功能研究提供支持。二、研究方法:首先,整理已报道的与糖脂代谢相关的遗传变异位点;然后,利用千人基因组计划提供的位点间连锁不平衡信息,填补出所有与lead SNP高度连锁不平衡的位点用于后续的精细定位和功能预测;接着,对这些位点进行系统的多组学注释,包括基因表达、染色质状态、DNA甲基化、组蛋白修饰、转录因子结合等。对位于编码区域的遗传变异位点,再进行物种间保守性估计、翻译后修饰等翻译水平的注释;,最后,整理推测出可能的基因型到表型调控路径。三、研究结果:对经筛选过滤后得到的592个糖脂代谢相关遗传变异位点进行填补后,共计17646个位点纳入后续精细定位分析(LD r2>0.5)。在转录水平,通过遗传变异与基因表达相关的注释,发现了 104个在内脏脂肪、肝脏、骨骼肌或胰岛细胞中与基因表达水平相关的位点。同时,发现了一些与特定环境刺激相关的eQTLs,如rs702485位点与DAGLB基因表达的关联仅出现在LPS刺激后(Pbefore>0.05,Pafter=2.52E-16)。133个糖脂代谢相关位点与脂肪组织或胰岛细胞中的DNA甲基化相关,其中许多位点与多个CpG位点的甲基化水平相关。经过对遗传变异位点的精细定位,我们发现有49个位点可以关联(tag)到一个或以上的位于组蛋白修饰信号峰区域内的位点,且具有组织特异性。在翻译水平,有122个(r2>0.5)或43个(r2>0.8)位点可以关联到一个或以上的非同义突变位点,其中有16个位点经SIFT和Polyphen注释均提示存在影响蛋白功能的可能。对糖代谢相关位点rsl535500精细定位和功能预测后发现,该位点G到T的变异与附近7个CpG位点的存在相关联,这些位点靠近KCNK17基因5’端的CpG岛,存在影响DNA甲基化的可能。通过对胰岛细胞中多个组学的信息整合,发现该位点确实可以通过影响附近位点甲基化水平进而影响KCNK17的表达,这不同于以往报道认为该信号主要通过KCNK16起作用。四、小结:(1)通过整合多个组学信息,对糖脂代谢GWAS信号进行重新解析后发现了许多可能参与到遗传变异影响表型调控路径中的基因及调控元件。与其他复杂表型类似,经过注释后,三分之一的基因与以往对该位点报道一致。(2)仅有7%-20%的糖脂代谢表型相关遗传变异位点可以关联到一个或以上的非同义或无义突变,其余可能通过转录水平影响表型。(3)通过对糖代谢相关的位点rs1535500的精细定位,发现该位点G到T的变异与附近位点CpG位点的存在相关联,进而影响甲基化水平调控KCNK17的表达。结论:基于以上三部分内容,得出以下结论:(1)在中国汉族人群中,rs651821(APO45)和rs671(ALDH2)位点的基因型与代谢综合征的遗传易感性相关;新发现的rs180326(BUD13)位点与血清TG水平的关联独立于区域内已知位点rs651821;rs671与饮酒行为存在交互效应。(2)结合转录调控注释信息可优化GWAS的筛选策略;rs1880118是一个在中国汉族人群中新发现的与血清HDL-C水平相关的遗传变异位点,与该位点高度连锁不平衡的rs4724806位点多态性会通过调控DAGLB基因表达影响表型。(3)80%以上的糖脂代谢相关位点主要通过调控转录水平影响表型;经多组学注释推测的调控基因中有三分之一与原GWAS报道的基因一致,如文献报道糖代谢相关位点rs1535500可能的调控基因为KCNK16,但注释信息提示该位点可能通过影响甲基化水平调控KCNK17的表达进而影响表型。
其他文献
从生态建筑定义、城市的环境规划、人居环境的评价及已建成的生态建筑来阐述生态建筑.
制定国家公园法已列入全国人大常委会立法规划,自然保护地法草案同时也在起草中。鉴于以往央地政府对建立自然保护地目的认识不一致、中央财政对国家级自然保护地投入偏低、
目的了解我院质子泵抑制剂(PPIs)临床使用合理性及趋势。方法采用回顾性分析方法随机抽取我院2013年8月份重点科室出院病历550份,对PPIs使用率、使用合理率、用药目的、用药
【正】 江华瑶族自治县是湖南瑶族分布最集中的一个县,全县人口据1990年统计为42万,瑶族占51%。本文拟对过山瑶与平地瑶作一比较研究,分析处在不同社会环境下的瑶族各部分发展
我国大多数装饰工程仍然采用传统的成本管理模式,一方面,无法准确地估算目标成本,另一方面,无法对实际成本进行有效控制,装饰工程成本管理效果不尽人意。面对激烈的市场竞争
<正>近日,山东中邮物流与徐州汉高洗涤剂有限公司达成合作协议,在全省范围内开展汉高“亮博士”洗衣粉、“亮博士”洗洁精和可蒙化妆品三类六种系列产品的配送和代收货款业务
会议
本论述主要以国内某钢管混凝土系杆拱桥为工程背景,为了防止施工过程中可能会出现的不利情况,采用BSAS软件建立有限元模型,对施工过程进行仿真模拟,结果表明:桥梁设计基本合
柴油发电机频率不稳故障,从油路、调速方面对康明斯柴油发电机组进行分析,提出油路检修解决方案和故障应急处理办法。
针对催化装置主风机组油泵存在的问题,制定油泵抗晃电技术方案,改造实施后油泵抗晃电能力明显提高,运行效果良好。
结合电站锅炉安装监督检验过程中的实际经验,分析、阐述电站锅炉安装单位建立质量管理体系进行监督检验的重要性及检验方法,同时列举监检过程中发现的主要问题。