论文部分内容阅读
骨质疏松症(Osteoporosis,OP)是最普遍的骨病,其特征是骨量低、骨组织微结构退化和骨强度下降。OP会导致骨脆性和骨折易感性增加。随着人口老龄化,骨量减少,骨折的风险将不断增加。它影响着跨越医疗、社会和经济领域的生活质量和数量。骨密度(Bone mineral density,BMD)可用于定义OP,也是骨质疏松性骨折风险的最佳预测指标。BMD具有很强的遗传成分,鉴定BMD的功能性遗传变异将增加我们对OP病理机制的理解。以前的研究大多着眼于能改变氨基酸序列的潜在功能变异。事实上,与RNA修饰有关的变异也可通过影响基因的转录后调控发挥生物学功能,因此,本研究探讨RNA修饰相关的遗传突变对BMD变化的影响。本研究分为三个部分:第一部分,我们根据RMVar数据库评估了 RNA 修饰相关 SNPs(RNA modification-associated SNPs,RNAm-SNP)与 32,961 名个体的股骨颈(Femoral neck,FN)和腰椎(Lumbar spine,LS)BMD的相关性,以及RNAm-SNP与426,824名个体的定量足跟超声骨密度(eBMD)和骨折风险的相关性,筛选出与BMD显著相关的各类RNAm-SNP。第二部分,我们进行了 eQTL分析来评估RNAm-SNP是否对基因的mRNA表达水平造成了影响;同时进行了差异表达分析和基于汇总数据的孟德尔随机化(Summary data-based Mendelian randomization,SMR)分析来检验这些基因是否是BMD变化的风险基因。第三部分,我们进行了 pQTL分析来探究RNAm-SNP与血浆蛋白水平的关联,应用功能富集分析和孟德尔随机化分析方法筛选出影响BMD的潜在风险蛋白。研究目的:本研究通过以下3个方面筛查GWAS定位的BMD相关基因组区域中的功能性变异,探究RNAm-SNP影响BMD的可能途径,解释相关易感基因遗传突变对OP的潜在致病机制。1筛选出与BMD有关的RNA修饰相关SNPs,探究不同类型的RNA修饰在OP中的潜在作用。2探究与BMD有关的RNA修饰相关SNPs是否通过调控相关基因的mRNA表达水平来影响BMD。3研究RNAm-SNP与血浆蛋白水平的关联,并筛选出与BMD存在潜在因果关联的蛋白。研究方法:在这项研究中,我们使用了 GEFOS进行的两次大规模BMD和骨折的GWAS的汇总数据来确定潜在的功能相关的RNAm-SNP。其中,Estrada等人共纳入32,961名具有欧洲和东亚血统的个体,他们对LS-BMD和FN-BMD进行了全基因组关联荟萃分析;Morris等人对来自英国生物银行(UKBiobank)的426,824名个体进行了 GWAS,确定了 eBMD和骨折的相关位点。我们从RMVar数据库中获得了 一系列RNAm-SNP的信息。RMVar数据库包含9种RNA修饰类型(m6A、m6Am、m1A、2’-O-Me、m5C、m5U、m7G、A-to-I 和假尿苷)的 1678126 个 RNAm-SNP。基于从RMVar数据库下载的RNAm-SNP信息,我们对BMD GWAS中的SNPs进行了注释,筛选出与BMD相关的RNAm-SNP(显著性水平设为P<5.0 × 10-8)进行下一步分析。由于RNAm-SNP在调控基因表达方面发挥着重要作用,我们进行了 eQTL分析,以确定在不同类型的细胞和组织中RNAm-SNP和基因表达水平之间的关联。我们从HaploReg数据库获得了 eQTL信息,着重研究了 RNAm-SNP与位于顺式作用eQTL中的基因之间的关系。另外,我们从GEO数据库下载了 GSE7158(单核细胞)、GSE2208(单核细胞)和GSE13850(B淋巴细胞)三个基因表达数据集进行了差异表达分析,检验BMD相关RNAm-SNP显示顺式eQTL效应的基因是否在不同BMD水平的人群中差异表达。如果一个基因在三项研究中的至少一项中出现差异表达,则该基因的表达水平与BMD相关。最后,我们通过整合GTEx project的eQTL数据和上述BMD和骨折GWAS数据,进行了 SMR分析,以评估全血、脂肪、骨骼肌、肝脏和卵巢这5个组织中的基因表达水平与BMD和骨折风险之间的相关性。为了进一步探究RNAm-SNP的功能效应,理解BMD损失的病理机制,我们还研究了 RNAm-SNP与血浆蛋白水平的关联,筛选了影响BMD和骨折风险的蛋白。我们在外周血中对已鉴定的RNAm-SNP进行了 pQTL分析,找出与BMD和骨折相关的蛋白质。接着,我们使用DAVID在线工具进行了 GO富集和KEGG分析,了解受BMD相关RNAm-SNP影响的蛋白质的潜在生物学功能。为了进一步评估pQTL分析鉴定出的蛋白质与BMD是否存在潜在的因果关系,我们进行了加权中值(weighted median)分析、逆方差加权(IVW)分析、MR-Egger分析。同时应用MR多效性残差和异常值(MR-PRESSO)分析和使用汇总效应估计的因果(CAUSE)分析来检测和校正水平多效性,筛选与BMD变化和骨折风险具有因果关联的蛋白。研究结果:1我们共筛选出337个与eBMD显著相关的RNAm-SNP,包括249个m6A、28 个m1A、3 个 m5C、7 个 m7G 和 13 个 A-to-I 相关的 SNPs。这些 RNAm-SNP共映射到255个已知基因,包括220个蛋白质编码基因和35个非编码基因。对于 eBMD,m6A-SNPs、m1A-SNPs、m7G-SNPs、A-to-I-SNPs 和 m5C-SNPs 的比例显著高于非RNAm-SNP。通过FGWAS方法,我们发现与eBMD相关的SNPs显著富集了 m6A-SNPs。我们发现了一些与BMD和骨折的关键基因有关的RNAm-SNP。例如,rs2229503 是SPTBN1的 m6A 和 m5C-SNP;rs643892 是 LRP5的 m1A-SNP;rs115790973 和 rs6815946是IDUA的m6A-SNPs。2通过eQTL分析,我们发现253个BMD相关的RNAm-SNP在不同的细胞或组织中表现出影响,其中119个RNAm-SNP对其所在基因具有顺式eQTL效应。一些鉴定出的RNAm-SNP会影响OP关键易感基因的表达。基因SPTBN1中的m6A和m5C-SNP rs2229503与SPTBN1的表达有关。基因LRP5中的m1A-SNP rs643892 与LRP5的表达有关。基因IDUA中的 m6A-SNP rs115790973 与FGFRL1的表达有关。差异表达分析共发现84个效应基因在至少一项GEO研究中差异表达,这些基因与BMD相关,其中包括SPTBN1这个重要基因。这84个差异表达的基因对应103个与BMD相关的RNAm-SNP,这些RNAm-SNP可能通过改变局部基因的表达水平来影响BMD。通过整合了 BMD和骨折GWAS以及来自GTEx项目的eQTL数据的SMR分析,我们发现5种相关组织类型中的基因表达与BMD水平之间存在显著关联。对于含有RNAm-SNP的23个基因,共检测到142个显著的多效性关联。我们还发现了一些OP易感基因的表达水平与eBMD显著相关。例如,在骨骼肌中,基因FGFRL1的表达水平与eBMD和骨折相关;在血液和脂肪中,基因SPTBN1的表达水平与eBMD相关。Rs2229503可能通过m6A和m5C RNA修饰调节SPTBN1的表达;rs643892可能通过m1A修饰调节LRP5的表达,从而影响BMD。3通过pQTL分析,我们发现96个RNAm-SNP的340个显著pQTL信号与eBMD显著相关。大多数pQTL信号呈现反式效应,而rs12660627、rs8898、rs6815946和rs28379706与其所在基因(分别为CD109、CTSB、IDUA和PLXNB2)编码的蛋白质的血浆水平相关。功能富集分析的结果显示,这些蛋白质在特定的KEGG途径中富集,如细胞因子-细胞因子受体相互作用、PI3K-Akt信号通路、NF-kappa B信号通路和MAPK信号通路。我们使用几种MR方法测试了 pQTL分析确定的蛋白质是否与BMD具有因果关联。经检验,有四种蛋白质通过了所有MR分析,包括SELE、IL3RA、ABO和ART4。另有18种蛋白质通过了除CAUSE 外所有 MR 分析,包括 ADGRF5、C1GALT1C1、CD109、CD209、CDH5、COL1A1、F8、FAM3D、GLCE、GOLM1、HBZ、ICAM5、IDUA、INSR、ISLR2、KDR、MICB和 QSOX2。4查阅文献发现,IDUA、COL1A1和CTSB是与BMD有关的重要蛋白。根据 pQTL 分析,rsl15790973、rs739468、rs11247975 和 rs11538062 是蛋白质 IDUA的 pQTL。其中,m6A-SNPs rs115790973 和 rs6815946 是 DGKQ 和 FGFRL1 的 2个eQTL位点,与这两个基因的表达水平有关。SMR分析显示,FGFRL1的表达水平可能与BMD具有因果关系。m5C-SNP rs11247975是CTBP1、DGKQ、RNF212和SPON2的eQTL位点,与这几个基因的表达水平有关。SMR分析显示,RNF212的表达水平可能与BMD具有因果关系。m6A-SNP rs11538062是CRIPAK、USVVA和MAEA的eQTL位点,与这三个基因的表达水平有关。Rs3814816、rs61217816 和 rs4760610 是蛋白质 COL1A1 的 pQTL。其中,m6A-SNP rs3814816是基因DICER1的eQTL效应位点,与该基因的表达水平有关。m6A-SNP rs4760610是ZNF641的eQTL位点,与ZNF641的表达水平有关。Rs2645429、rs8898 和 rs1047643 是蛋白质 CTSB 的 pQTL 位点,m6A-SNPs rs2645429、rs8898 和m1A-SNP rs1047643 都是基因CTSB的 eQTL 位点,与该基因的表达水平有关。SMR分析提示,CTSB的表达水平可能与BMD具有因果关系。我们认为,一方面,上述这些SNP的RNA修饰活动可能会影响相应基因的表达水平,进而影响BMD。另一方面,这些SNP的RNA修饰活动可能会影响蛋白质IDAU、COL1A1和CTSB的水平,从而导致BMD的改变。研究结论:该研究发现了许多与BMD相关的RNAm-SNP,表明RNA修饰可能对BMD的改变具有重要作用。SPTBN1、LRP5和IDUA是已知的调节BMD的核心基因。Rs2229503、rs643892、rs115790973 和 rs6815946 可能通过 m6A 和 m5C 修饰调节这三个基因的表达,影响BMD。IDUA、COL1A1和CTSB是与BMD的改变相关的重要蛋白。Rs115790973、rs6815946、rs11247975、rs11538062、rs3814816、rs61217816、rs47606、rs2645429、rs1047643 和 rs8898 可能通过 m6A、m5C和m1A修饰影响IDAU、COL1A1和CTSB蛋白的水平,影响BMD。