论文部分内容阅读
第一部分 加权基因共表达网络筛选血脂异常易感基因背景:近年来,我国居民血脂异常患病率呈持续增长趋势,但知晓率、治疗率和控制率却仍不理想。血脂异常是一类复杂性疾病,其发病受环境、遗传和环境-遗传因素相互作用的影响。其中,约有40-60%血脂异常发生与遗传因素相关。由此可见,遗传对血脂异常的影响不容忽视。随着人类基因组计划的完成、高通量测序技术的实现及基因芯片数据分析方法的更新,让探索基因与疾病之间的关系成为了当下的主流研究。因此,积极寻找与血脂异常发生发展密切相关的易感基因和/或遗传学标记将有助于我们从基因组学层面上去深入探究疾病的致病机理。目的:本研究应用加权基因共表达网络分析(Weight Gene Co-expression Network Analysis,WGCNA)方法对GSE3059数据集进行挖掘及分析,以期筛选出与血脂异常有关的易感基因或遗传学标记。方法:从美国国家生物信息中心(National center for biological information,NCBI)成立的基因表达数据库(Gene Expression Omnibus,GEO)中下载本研究所用的GSE3059数据集。随后采用WGCNA分析方法构建基因模块。通过蛋白质-蛋白质互作网络(Protein-protein interaction Networks Functional Enrichment Analysis,PPI)了解基因模块之间的共表达关系。通过Cytoscope筛选出易感基因。最后通过京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)以及基因本体论(Gene ontology consortium,GO)数据库对易感基因进行代谢通路及基因功能富集。结果:1.通过WGCNA分析方法,我们成功构建了7个基因模块,分别是blue、yellow、red、turquoise、green、brown和grey模块。将基因模块与临床表型结合后发现,brown和red模块与血脂异常呈正相关,blue、yellow、turquoise、green和grey模块与血脂异常呈负相关。2.以基因模块与基因相关系数大于0.85作为血脂异常候选易感基因的选择标准,我们共获得213个候选易感基因。将候选基因通过蛋白质-蛋白质互作网络(PPI)我们共获得111个节点和67条边。用Cytoscope插件MOCDE进行模块挖掘发现brown模块为本课题研究的易感基因模块,该模块中的31个基因(RPL3、RPL12、RPL14、RPL15、RPL18、RPL19、RPL22、RPL29、RPL30、RPL31、RPL32、RPL35、RPL36、RPS9、RPS10、RPS12、RPS15、RPS17、RPS21、RPS28、RPS29、FAU、PABPC1、RPLP0、IMP3、RPL10A、FBL、EIF3F、EIF3K、EIF3D和RPL23A)为本课题所挖掘出的血脂异常易感基因。3.利用R软件cluster Profiler对易感基因进行KEGG和GO功能富集,发现易感基因功能主要与核糖体相关。4.易感基因的基因表达量在对照组和血脂异常组中比较发现,RPS9、RPS10、RPS12、RPS17、RPL12、RPL14、RPL15、RPL19、RPL22、RPL29、RPL32、RPLP0、RPL10A、IMP3、EIF3D、EIF3K、FAU和PABPC1等18个易感基因在血脂异常组中表达量高于对照组,且差异有统计学意义(均P<0.05)。结论:1.本研究筛选出31个血脂异常易感基因(RPL3、RPL12、RPL14、RPL15、RPL18、RPL19、RPL22、RPL29、RPL30、RPL31、RPL32、RPL35、RPL36、RPS9、RPS10、RPS12、RPS15、RPS17、RPS21、RPS28、RPS29、FAU、PABPC1、RPLP0、IMP3、RPL10A、FBL、EIF3F、EIF3K、EIF3D和RPL23A)。2.共有18个易感基因在血脂异常组中表达量显著高于对照组(RPS9、RPS10、RPS12、RPS17、RPL12、RPL14、RPL15、RPL19、RPL22、RPL29、RPL32、RPLP0、RPL10A、IMP3、EIF3D、EIF3K、FAU和PABPC1)。3.本研究筛选出的31个血脂异常易感基因的功能与核糖体相关联。第二部分RPLP0、KRS2和HNF1A多态性与广西毛南族和汉族人群血脂水平的关系背景:12号染色体上富含与人类疾病相关的基因组。近期研究发现,12号染色体长臂2区4带(12q24)是血脂异常的易感区域。核糖体磷蛋白大亚基P0(RPLP0)、RAS2激酶抑制剂(KSR2)和肝细胞核因子1A基因(HNF1A)均位于该区域。以欧美人群为背景的研究发现KSR2和HNF1A多态性与血脂异常密切相关。然而,此类研究却很少在中国人群甚至亚洲人群中开展。此外,即使相同的基因和突变位点,其基因型频率与血脂水平的关系在不同种族和不同人群中仍可能存在着差异。因此,在特定人群中去重复验证基因多态性位点与血脂水平的关系,将有助于我们针对特定人群制定个体化的诊疗方案。广西是一个少数民族聚居地,其中毛南族是广西特有的少数民族之一,其地理位置、居住环境、饮食习惯、族内通婚和遗传背景等特征与汉族人群有较大的差异,因此是我们研究环境因素、基因遗传特质的较佳群体。目的:探讨RPLP0、KRS2和HNF1A基因单核苷酸多态性(Single nucleotide polymorphism,SNPs)与广西毛南族和汉族人群血脂水平之间的关系。方法:在先前分层随机的标本库中,随机抽取居住于广西环江县毛南族居民750人和当地汉族居民793人作为研究对象。所有研究对象均行血脂水平检测及心血管疾病危险因素流行病学的调查。采用聚合酶链反应-限制性片段长度多态性(PCR-RFLP)联合直接测序法对RPLP0 rs2074540,KRS2rs10774926、KRS2 rs11068503、KRS2 rs11830157,HNF1A rs2071190、HNF1A rs2464196、HNF1A rs2244608共7个SNPs进行基因分型。分析比较各基因位点的基因型及等位基因频率在两个民族之间的分布情况以及探讨其与环境、血脂水平的相关性。结果:1.广西毛南族和汉族人群在腰围、吸烟、饮酒、收缩压、舒张压、脉压、总胆固醇(TC)、甘油三酯(TG)及高密度脂蛋白胆固醇(HDL-C)水平比较差异有统计学意义。其中毛南族人群腰围、吸烟、饮酒、收缩压、舒张压、脉压、TC及TG水平均明显高于汉族人群(均P<0.05),而HDL-C则低于汉族人群(P<0.05)。2.RPLP0 rs2074540基因型与等位基因频率在毛南族和汉族以及毛南族男女性别之间比较差异有统计学意义;KSR2 rs11068503基因型与等位基因型频率在毛南族男女之间比较差异有统计学意义;KSR2 rs11830157等位基因频率在两民族之间比较差异有统计学意义;HNF1A rs2071190基因型及等位基因型频率在两民族之间比较差异有统计学意义;rs2464196基因型和等位基因型频率在两民族间、汉族男女之间及等位基因频率在毛南族男性之间比较差异显著的统计学差异(均P<0.05)。3.汉族人群HNF1A rs11830157不同基因型的Apo B水平,HNF1A rs2071190不同基因型的TG、Apo B水平和Apo A1/Apo B比值,rs2464196不同基因型的TC水平比较差异有统计学意义(7个SNPs经Bonferroni校正后P<0.00714具有统计学意义)。毛南族人群RPLP0 rs2074540不同基因型的HDL-C水平和Apo A1/Apo B比值,KRS2 rs10774926不同基因型的TG、LDL-C和Apo B水平,HNF1A rs2244608不同基因型的Apo A1/Apo B比值比较差异有统计学意义(P<0.00714)。4.在汉族男性亚组中,RPLP0 rs2074540和KSR2 rs11830157不同基因型的血清Apo B水平,KSR2 rs2071190不同基因型的血清Apo A1/Apo B比值,rs2464196不同基因型的TC水平之间比较差异有统计学意义(Bonferroni校正后P<0.00714)。在汉族女性亚组中,RPLP0 rs2074540不同基因型的Apo A1/Apo B比值,KSR2 rs2071190不同基因型的血清TG水平,HNF1A rs2244608不同基因型的TG和TC水平之间相比较差异有统计学意义(Bonferroni校正后P<0.00714)。5.在毛南族男性亚组中,HNF1A rs2244608不同基因型的Apo A1/Apo B比值,rs2464196不同基因型的LDL-C和Apo B水平之间比较差异有统计学意义。在毛南族女性亚组中,RPLP0 rs2074540不同基因型的HDL-C和Apo A1水平,KSR2 rs11068503不同基因型的HDL-C水平和Apo A1/Apo B比值,HNF1A rs2244608不同基因型的TG水平之间相比较差异均有统计学意义(Bonferroni校正后P<0.00714)。6.多重因素回归分析结果显示,两个民族的血脂水平也与年龄、性别、腰围、饮酒、吸烟、血糖、身高和基因型等环境因素密切相关。结论:1.广西毛南族与当地的汉族人群血脂水平比较差异有统计学意义。2.RPLP0、KSR2和HNF1A多态性对两民族人群血脂水平的影响不同,具有民族和性别特异性。3.广西汉族与毛南族血脂水平也与年龄、性别、腰围、吸烟和饮酒等环境因素相关联。第三部分RPLP0、KRS2和HNF1A多态性与缺血性心脑血管疾病的关系背景:近几十年来,我国缺血性心脑血管疾病的发病率和死亡率呈逐年攀升趋势,给国家和人民造成了沉重的精神和经济负担。冠心病(Coronary heart disease,CHD)和缺血性脑卒中(Ischemic stroke,IS)是缺血性心脑血管疾病中常见的两类疾病。血脂异常是CHD和IS发病独立的危险因素和共同的病理基础。既往研究证实,CHD及IS的发生发展受到遗传因素、环境因素以及遗传-环境因素的共同影响。本文第二部分研究发现在广西毛南族和当地汉族人群中位于12q24染色体区域的RPLP0、HNF1A和KSR2多态性与血脂水平相关。因此,我们推测RPLP0、HNF1A和KSR2多态性也与CHD及IS也存在一定的关联性。目的:探讨RPLP0、HNF1A和KRS2单核苷酸多态性(RPLP0 rs2074540、KSR2 rs10774926、KSR2 rs11068503、KSR2 rs11830157、HNF1A rs2071190、HNF1A rs2244608、HNF1A rs2464196)与CHD和IS发病风险的关系,以及基因-基因之间和基因-环境之间的交互作用。方法:在广西汉族人群中进行病例-对照研究,其中正常对照组523例,经冠状动脉造影检查后确诊为CHD患者549例和经临床确诊为IS患者511例。采用聚合酶链反应-限制性片段长度多态性(PCR-RFLP)联合直接测序法对RPLP0 rs2074540,KRS2 rs10774926、rs11068503、rs11830157,HNF1A rs2071190、rs2464196、rs2244608共7个SNPs进行基因分型。分析比较各位点的基因型及等位基因在对照组和病例组的分布情况,以及探讨它们与环境和基因的相互作用对缺血性心脑血管疾病患病风险的影响。结果:1.CHD组身高、体重、体重指数(BMI)、收缩压、脉压、TC及TG水平均高于对照组,而血清TC、HDL-C、Apo A1水平、Apo A1/Apo B比值以及饮酒人数百分比均低于对照组(均P<0.05);IS组身高、体重、体重指数(BMI)、收缩压、舒张压、脉压、TC及TG水平均高于对照组,而血清TC、HDL-C、Apo A1水平、Apo A1/Apo B比值以及饮酒人数百分比均低于对照组(均P<0.05);2.CHD组中,KSR2 rs11830157、HNF1A rs2244608和HNF1A rs2464196SNPs的基因型和等位基因频率与对照组相比差异有统计学意义;IS组中,KSR2 rs11830157等位基因频率与对照组相比差异有统计学意义;HNF1A rs2244608基因型和等位基因频率与对照组相比较差异有统计学意义(均P<0.05)。3.在CHD组中建立RPLP0、KSR2和HNF1A位点的五种遗传学模型发现,KSR2 rs11830157在显性模型TT vs.GT+GG(OR=1.40,95%CI=1.10-1.78,P=0.006)中可升高CHD的风险;HNF1A rs2244608在显性模型CC vs.CT+TT(OR=0.59,95%CI=0.44-0.81,P=7E-04)及加性模型C vs.T(OR=0.70,95%CI=0.58-0.85,P=3E-04)中可降低CHD的风险;HNF1A rs2464196在共显性模型TT vs.CC(OR=0.58,95%CI=0.39-0.87,P=0.00706)及隐性模型TT+CT vs.CC(OR=0.58,95%CI=0.41-0.84),P=0.0018)可降低CHD的风险。剩余位点暂未发现与CHD的发病风险相关。4.在IS组中建立RPLP0、KSR2和HNF1A位点的五种遗传学模型,KSR2 rs11830157在显性模型TT vs.GT+GG(OR=1.36,95%CI=1.25-2.52,P<0.0001)中可升高IS的发病风险。HNF1A rs2244608在显性模型CC vs.CT+TT(OR=0.38,95%CI=0.27-0.54,P<0.0001)中可降低IS的发病风险。rs2464196在加性模型C vs.T(OR=0.74,95%CI=0.60-0.91,P=0.0041)中可降低IS的发病风险。剩余位点暂未发现与IS的发病风险相关。5.对RPLP0、KSR2和HNF1A位点进行连锁不平衡分析时发现,在CHD组和IS组中KSR2 rs10774926、rs11068503及rs11830157三个位点间存在连锁不平衡。在CHD组中,最常见的单倍体为A-C-T,与最常见单倍体相比携带A-T-T(OR=0.71,95%CI=0.52-0.98,P=0.039)和A-T-G(OR=0.59,95%CI=0.39-0.91,P=0.017)单体型者患CHD的风险降低;而AC-G(OR=1.50,95%CI=1.08-2.08,P=0.017)和G-T-G(OR=2.37,95%CI=1.35-4.19,P=0.0029)单体型携带者患CHD的风险增高。在IS组中,最常见的单倍体为A-C-T,与最常见单倍体相比携带A-C-G(OR=1.66,95%CI=1.01-2.28,P=0.005)单体型者患IS的风险升高,而携带A-T-G(OR=0.61,95%CI=0.42-0.89,P=0.009)单体型者患IS的风险降低。6.通过对RPLP0、KSR2和HNF1A的广义多因素降维(GMDR)分析发现,基因-基因交互作用[RPLP0 rs2074540-KSR2-rs10774926(rs11830157)-HNF1A rs2464196]在CHD的发病中起着重要的作用;基因-环境交互作用(高血压-rs2074540-rs10774926-rs11068503-rs11830157)在CHD的发病中也起重要的作用。基因-基因交互作用[RPLP0 rs2074540-KSR2 rs11068503-HNF1A rs2071190(rs2244608)]在IS的发病中起着重要作用。基因-环境交互作用(年龄-高血压-rs10774926-rs11068503-rs11830157-rs2464196)在IS的发病中也起着重要的作用。结论:1.CHD组和IS组的一般情况及血脂水平与对照组比较差异有统计学意义。2.CHD组和IS组的KSR2 rs11830157、HNF1A rs2244608、rs2464196基因型或/和等位基因型频率与对照组比较差异有统计学意义。3.在遗传模型研究中,KSR2 rs11830157可升高CHD和IS的风险,而HNF1A rs2244608和HNF1A rs2464196可降低CHD和IS的风险。4.KSR2单倍体对CHD及IS的发病风险有影响。5.rs2074540-rs10774926-rs11830157-rs2464196及高血压-rs2074540-rs10774926-rs11068503-rs11830157交互作用影响CHD的发病风险;rs2074540-rs11068503-rs2071190-rs2244608及年龄-高血压-rs10774926-rs11068503-rs11830157-rs2464196交互作用则影响IS的发病风险。