人类数量性状遗传位点数据库的构建及应用

来源 :天津医科大学 | 被引量 : 0次 | 上传用户:hhuzw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:近年来,随着基因组测序以及功能基因组图谱的完善,大量分子表型数量性状位点(x QTL)的研究大量涌现。这些QTL的研究将基因型与组织/细胞类型的细胞特异性功能从转录水平到转录后水平的变化联系起来。然而,目前并没有一个支持跨多种分子表型查询以及探究功能性变异潜在级联效应的全面的数量性状遗传位点数据库。因此,本研究的首要目的是根据现有的多种类型的数量性状遗传位点数据和相关变异的功能注释信息,建立一个多角度查询的数量性状遗传位点数据库QTLbase,用于解释遗传变异的可能分子功能及其组织细胞特异性,并且提供变异的注释信息,为研究者了解变异的潜在功能进而探究其作用机制提供一个新的角度和方向。与此同时,GWAS研究发现了很多与自身免疫性疾病相关的位点,然而在自身免疫疾病发生发展过程中发挥作用的因果变异及其作用方式目前尚不清楚。因此,我们结合功能注释信息和QTL相关分析等对自身免疫性疾病基因多效性的遗传位点进行优先级排序并筛选最有可能具有调控功能的变异,进而探究该自身免疫性疾病基因多效性遗传位点作为基因表达数量性状位点(e QTL)调控基因的表达水平并整合生物信息学预测分析进一步提出其影响自身免疫性疾病的分子作用机制模型。变异分子机制的探究加深了我们对疾病的理解和认识,进而帮助我们提出更加有效的治疗方法。方法:本研究从Google Scholar和Pub Med利用x QTL研究相关词语作为关键词进行搜索以收集整理人类分子表型相关QTL研究。为了降低数据之间的异质性,我们首先将单核苷酸多态性(Single nucleotide polymorphism,SNP)统一映射到db SNP 151版本,同时将分子表型数据根据不同的QTL类型特点进行标准化处理。本研究参考GTEx和Expression Atlas项目对收集的组织/细胞类型进行标准化映射以实现组织/细胞类型命名方式的统一。与此同时,我们从其他数据库或者网站共收集整理了20种功能注释信息,按照不同的用法将其分为四个类别,即变异相关信息,功能预测信息,功能证据信息以及疾病相关信息。我们将上述方法得到统一标准化的数据和功能注释信息存入My SQL,用于构建人类数量性状遗传位点数据库QTLbase。为了进一步探究自身免疫性疾病基因多效性位点相关变异的分子作用机制,我们首先通过功能富集分析和x QTL共定位分析,结合功能注释信息对自身免疫性疾病基因多效性位点进行优先级排序,进而筛选得到潜在具有调控功能的变异rs4728142。通过整合GTEx项目、Blueprint项目和Geuvadis数据进行QTL分析发现该变异可以作为e QTL和转录本启动子利用数量性状位点(tu QTL)调控IRF5基因表达水平和转录本表达水平的改变。环状染色体构象捕获(4C)实验证明rs4728142区域与IRF5启动子之间存在相互作用。我们通过生物信息学分析进一步证明上述结果并提出rs4728142分子作用机制模型。结果与结论:本研究中建立的QTLbase数据库共包含以下5个主要功能:(1)收集整理233篇独立的QTL研究共涵盖13种类型人类数量性状遗传位点;(2)参考标准命名方式将78种QTL相关组织细胞类型术语统一;(3)将变异信息和性状信息进行标准化处理,得到171,524,441对显著的(P-value≤0.05)变异-性状关联,其中包括顺式QTLs共159,197,054个和反式QTLs 12,327,373个;(4)建立网站客户端,实现按表型查询和组织查询结果的可视化;(5)整合最全面的基因组特征数据以及功能预测信息,以注释QTL的潜在作用机制。综上所述,本研究建立的QTLbase数据库提供了支持跨多种组织细胞类型以及多种分子表型的QTL查询功能,可以极大的帮助研究者解释因果变异背后的生物学作用机制并且可以指导功能的验证。QTLbase可以通过以下网站免费访问:http://mulinlab.org/qtlbase。通过对影响自身免疫性疾病基因多效性位点进行功能注释、x QTL共定位分析以及其他调控靶基因通路分析,将440个与自身免疫性疾病相关基因多效性位点进行优先级排序并筛选出最有可能具有调控功能的变异rs4728142。QTLbase数据库查询结果显示该位点可以在多种组织细胞中调控IRF5基因的表达。同时,我们通过整合GTEx项目、Blueprint项目和Geuvadis项目RNA-seq全基因组测序数据进行特定组织/细胞类型下的基因表达QTL和转录本使用QTL分析,发现rs4728142在特定组织细胞类型下可以影响IRF5基因表达水平以及不同等位基因下切换长短转录本的表达水平。进一步,通过环状染色质构象捕获实验发现结构蛋白ZBTB3可以介导的rs4728142区域与IRF5启动子之间环状结构的形成并且可以通过影响其环状结构的结合能力进而实现调控IRF5长短转录本的表达水平。RNA-seq实验证明敲除rs4728142所在区域差异基因可以富集于自身免疫性疾病相关通路。最终,我们提出了rs4728142作为tu QTL影响免疫应答的分子作用机制模型,即rs4728142的G等位基因可通过减弱转录因子ZBTB3的结合,影响位于rs4728142上游的增强子对IRF5长短转录本的表达水平;当其变为A等位基因时,可以通过招募ZBTB3与下游IRF5短转录本启动子区域形成环结构,使得上游增强子增加对IRF5短转录本的调控,进而促进短转录本的表达。
其他文献
随着全球汽车工业的飞速发展,汽车电子行业日趋成熟,车载多媒体已成为车主日常出行必不可少的娱乐产品。提升车载多媒体的功能、性能和用户体验,成为了各大制造厂商的必争之
架空输电线路作为我国电力巡检的主要输电设施,保证它安全稳定的运行对我国电力发展至关重要。而电力杆塔上的绝缘子不仅是输电线路中的重要部件,也是电力巡检过程中的主要目标。及时对绝缘子进行提取分类并识别故障,并采取有效的措施,才能够保证整条输电线路的安全可靠运行。因此,本文针对无人机搭载LiDAR技术在电力巡检过程中所采集的点云数据图像处理问题展开研究,重点研究了整段输电线路的点云数据的预处理方法,以及
本研究于2013年在湖北省恩施州崔坝镇进行,设置高、中、低3个海拔梯度(海拔高度分别为1560 m、1200 m、800 m),以鄂烟1号为材料,研究了海拔高度对白肋烟植物学性状、叶片光合特
特色小镇同城市一样面临着城镇化带来的人口剧增、交通拥堵、能耗增加、环境恶化、规划落后等问题。对特色小镇热点区域进行短时预测,有利于解决人群聚集安全、交通拥堵问题,提醒商户们提前做好准备以提供更好的服务。因此,本文基于深度学习的方法构建了特色小镇热点区域短时预测模型并对预测结果进行可视化。本文的主要工作如下:(1)针对目前已有的热点区域预测方法主要面向城市、不适合特色小镇的问题,本文结合特色小镇的实
背景糖尿病周围神经病变是糖尿病远期并发症中发病率最高的。伴随糖尿病患病率攀升,作为其微血管并发症的周围神经病变亦呈逐年上升趋势,其累及的感觉、运动、自主神经损害可
显著性检测是图像处理工作的一部分,也是其多数任务的预处理步骤,目的是将整张图像中最引人注目的一部分检测并分割出来,一般来说这部分图像所包含的信息量最大也最重要。如今,显著性检测已被广泛运用在图像检索、图像分类、目标检测、图像分割等领域。随着科技的进步,基于人工提取特征的传统显著性检测方法愈发成熟;而深度学习方法的引入,亦使显著性检测的效率更进一步。但两个方向的方法皆有不足之处,如传统方法中对边界依
随着我国社会的快速发展,城市化进程日益加快,生活垃圾的总量不断攀升,垃圾焚烧发电法得到了越来越广泛的应用。由于该过程具有干扰频繁、强耦合、非线性等复杂特性,不利于控制系统的设计与实现,可能会引起一系列环境污染问题,因而有关该过程的稳定控制、运行优化和参数软测量研究受到了广泛关注。为了使现场调试的成本和风险降到最低,在实际工业现场实施运行优化、稳定控制等方法前,需在实验室进行仿真实验以确定方法的安全
近年来,我国旅游安全问题随着旅游业的发展呈现出逐年上升的趋势。青海省地处祖国的西北高原,2006年青藏铁路全线通车后促进了青海旅游资源的开发,降低了进入的门槛,拓展客源市场[1]。同时,伴随着青海省旅游的快速发展,旅游安全问题也引起了大家的关注。但是,旅游安全管理方面的研究还没有广泛引起社会各界的注意,相关学术研究相对比较薄弱。本研究首先从旅游安全管理的概念作为切入点,明确具体的研究对象。其次,再
由于无人水下航行器(Unmanned Underwater Vehicles,简称UUV)具有体量小、隐蔽性高、自主性强等优点,并且当前研制的UUV集成任务模块攻击模块,这类UUV在未来战场上有着很大的
磁性液体是一种独特的具有超顺磁性的固液两相胶体溶液的功能材料,它的出现开拓了许多固体磁性材料无法胜任的应用领域,磁性液体特有的磁浮性能可在外加磁场的作用下随磁场发