论文部分内容阅读
目的:近年来,随着基因组测序以及功能基因组图谱的完善,大量分子表型数量性状位点(x QTL)的研究大量涌现。这些QTL的研究将基因型与组织/细胞类型的细胞特异性功能从转录水平到转录后水平的变化联系起来。然而,目前并没有一个支持跨多种分子表型查询以及探究功能性变异潜在级联效应的全面的数量性状遗传位点数据库。因此,本研究的首要目的是根据现有的多种类型的数量性状遗传位点数据和相关变异的功能注释信息,建立一个多角度查询的数量性状遗传位点数据库QTLbase,用于解释遗传变异的可能分子功能及其组织细胞特异性,并且提供变异的注释信息,为研究者了解变异的潜在功能进而探究其作用机制提供一个新的角度和方向。与此同时,GWAS研究发现了很多与自身免疫性疾病相关的位点,然而在自身免疫疾病发生发展过程中发挥作用的因果变异及其作用方式目前尚不清楚。因此,我们结合功能注释信息和QTL相关分析等对自身免疫性疾病基因多效性的遗传位点进行优先级排序并筛选最有可能具有调控功能的变异,进而探究该自身免疫性疾病基因多效性遗传位点作为基因表达数量性状位点(e QTL)调控基因的表达水平并整合生物信息学预测分析进一步提出其影响自身免疫性疾病的分子作用机制模型。变异分子机制的探究加深了我们对疾病的理解和认识,进而帮助我们提出更加有效的治疗方法。方法:本研究从Google Scholar和Pub Med利用x QTL研究相关词语作为关键词进行搜索以收集整理人类分子表型相关QTL研究。为了降低数据之间的异质性,我们首先将单核苷酸多态性(Single nucleotide polymorphism,SNP)统一映射到db SNP 151版本,同时将分子表型数据根据不同的QTL类型特点进行标准化处理。本研究参考GTEx和Expression Atlas项目对收集的组织/细胞类型进行标准化映射以实现组织/细胞类型命名方式的统一。与此同时,我们从其他数据库或者网站共收集整理了20种功能注释信息,按照不同的用法将其分为四个类别,即变异相关信息,功能预测信息,功能证据信息以及疾病相关信息。我们将上述方法得到统一标准化的数据和功能注释信息存入My SQL,用于构建人类数量性状遗传位点数据库QTLbase。为了进一步探究自身免疫性疾病基因多效性位点相关变异的分子作用机制,我们首先通过功能富集分析和x QTL共定位分析,结合功能注释信息对自身免疫性疾病基因多效性位点进行优先级排序,进而筛选得到潜在具有调控功能的变异rs4728142。通过整合GTEx项目、Blueprint项目和Geuvadis数据进行QTL分析发现该变异可以作为e QTL和转录本启动子利用数量性状位点(tu QTL)调控IRF5基因表达水平和转录本表达水平的改变。环状染色体构象捕获(4C)实验证明rs4728142区域与IRF5启动子之间存在相互作用。我们通过生物信息学分析进一步证明上述结果并提出rs4728142分子作用机制模型。结果与结论:本研究中建立的QTLbase数据库共包含以下5个主要功能:(1)收集整理233篇独立的QTL研究共涵盖13种类型人类数量性状遗传位点;(2)参考标准命名方式将78种QTL相关组织细胞类型术语统一;(3)将变异信息和性状信息进行标准化处理,得到171,524,441对显著的(P-value≤0.05)变异-性状关联,其中包括顺式QTLs共159,197,054个和反式QTLs 12,327,373个;(4)建立网站客户端,实现按表型查询和组织查询结果的可视化;(5)整合最全面的基因组特征数据以及功能预测信息,以注释QTL的潜在作用机制。综上所述,本研究建立的QTLbase数据库提供了支持跨多种组织细胞类型以及多种分子表型的QTL查询功能,可以极大的帮助研究者解释因果变异背后的生物学作用机制并且可以指导功能的验证。QTLbase可以通过以下网站免费访问:http://mulinlab.org/qtlbase。通过对影响自身免疫性疾病基因多效性位点进行功能注释、x QTL共定位分析以及其他调控靶基因通路分析,将440个与自身免疫性疾病相关基因多效性位点进行优先级排序并筛选出最有可能具有调控功能的变异rs4728142。QTLbase数据库查询结果显示该位点可以在多种组织细胞中调控IRF5基因的表达。同时,我们通过整合GTEx项目、Blueprint项目和Geuvadis项目RNA-seq全基因组测序数据进行特定组织/细胞类型下的基因表达QTL和转录本使用QTL分析,发现rs4728142在特定组织细胞类型下可以影响IRF5基因表达水平以及不同等位基因下切换长短转录本的表达水平。进一步,通过环状染色质构象捕获实验发现结构蛋白ZBTB3可以介导的rs4728142区域与IRF5启动子之间环状结构的形成并且可以通过影响其环状结构的结合能力进而实现调控IRF5长短转录本的表达水平。RNA-seq实验证明敲除rs4728142所在区域差异基因可以富集于自身免疫性疾病相关通路。最终,我们提出了rs4728142作为tu QTL影响免疫应答的分子作用机制模型,即rs4728142的G等位基因可通过减弱转录因子ZBTB3的结合,影响位于rs4728142上游的增强子对IRF5长短转录本的表达水平;当其变为A等位基因时,可以通过招募ZBTB3与下游IRF5短转录本启动子区域形成环结构,使得上游增强子增加对IRF5短转录本的调控,进而促进短转录本的表达。