论文部分内容阅读
背景与目的血红蛋白病是全世界最常见的单基因遗传病。其中,β类血红蛋白病,尤其是血红蛋白S病和β地中海贫血症是一类会导致严重临床表型的血红蛋白病,由于它们严重的致病性和高发生频率而引起全球的健康负担。事实证明,先前已有的团队对于预防血红蛋白病的努力和方案已经在地中海贫血患者中被证实是十分有效的。尤其是对居住在地中海地区的居民,2009年地中海贫血的发生率从1:250减少到1:1660。然而,血红蛋白病的出生率仍然高居不下。在中国,每年估计约有36000名新生儿患有各种类型的血红蛋白病,会造成严重的社会负担。胎儿血红蛋白向成人血红蛋白的转换被认为是对于血红蛋白病而言十分重要的修饰机制,先前的研究表明,胎儿血红蛋白表达的升高能改善β类血红蛋白病的严重程度。因此,精确诊断血红蛋白病不仅需要对珠蛋白基因簇中致病基因的突变进行正确的基因分型,更需要对于这些在临床上有很大作用的修饰基因,如KLF1,BCL11 和GATA1等,它们通过影响γ-珠蛋白的表达水平,从而影响β-地中海贫血患者的表型严重程度。有许多的团队已经做出巨大努力,通过建立数据库来记录引起和修饰血红蛋白病的各种基因上的突变。例如HbVar,是有由Giardine教授等人建立。是迄今为止对于研究人员和临床医生都具有很高权威性的血红蛋白病综合数据库。但是这类数据库的数据来源为世界范围,并没有种族和民族特异性。因此,在中国人群的大背景下,我们如果能为临床医生开发一个全面又强大的系统,通过标准指南,快速为血红蛋白病患者做出正确的辅助遗传咨询和精确诊断,那么这样可以大大减少血红蛋白病的患儿数量。方法与结果LOVD数据库是中国人群以血红蛋白病为导向的突变数据库,关于基因突变位点的数据收集主要来源于两个方面,第一个方面是对于公共数据的挖掘,包括数据库(HbVar:http://globin.cse.psu.edu/;IthaGenes:http://www.ithanet.eu/db/ithagenes),文献挖掘来自PubMed(https://www.ncbi.nlm.nih.gov/pubmed)和中文核心期刊(http://xueshu.baidu.com/)。另一个来源是本实验室的未发表的数据,包括来自2087名血红蛋白病患者的高通量测序数据的表型与基因型一一对应的数据集,以及20222名中国南方个体捕获区域测序的数据。我们把与血红蛋白病相关基因分为了两个部分,珠蛋白基因[HBA1(MIM 141800),HBA2(MIM 141850),HBB(MIM 141900),HBG1(MIM 142200),HBG2(MIM 142250)和HBD(MIM 142000)]和非珠蛋白基因[BCL11A MIM 606557),KLF1(MIM 600599)和GATA1(MIM 305371)]以及HBSIL-MYB(MIM 142470)的基因间区域被归类为致病基因和修饰基因两个大类,并且将被作为关键词对血红蛋白病进行文献挖掘。目前,我们的数据库共记录了 355个不同的突变,其中265个为致病基因突变,而90个是修饰基因突变,涵盖了我们本地数据中挖掘出的通过高通量测序数据的数量性状关联研究所鉴定出的18个功能突变。该数据库可在http://www.genomed.org/LOVD/index.php上获取。DASH系统称为血红蛋白病在线辅助精确诊断及风险评估系统,我们基于以下的数据作为基础,建立了 DASH系统:(ⅰ)我们有LOVD这样的中国人群目前最全的血红蛋白病致病基因及修饰基因突变谱(ⅱ)我们有22309例样本的综合表型与基因型一一对应的数据集(ⅲ)我们得到了 HbVar数据库的许可,使用其最新更新版本的开源数据作为我们注释库的一部分。为了辅助中国人血红蛋白病的分子筛选和临床基因分型,DASH由三个主要的工作流程组成。DASH不仅能根据血液学表型的输入来推断地中海贫血的类型,而且还识别上传的拷贝数变异(CNV)和单核苷酸变异(SNV)数据,然后用特定的血红蛋白病注释库来进行注释。综合分析评估致病基因以及修饰基因,最终来实现血红蛋白病的精确诊断。此外,该系统将对已知致病突变进行风险评估,并揭示潜在后代风险。DASH将自动提供诊断和评估报告,为血红蛋白病的诊断和遗传咨询提供准确的建议。DASH 可在 www.smuhemoglobinopathy.com 上找到。(http://39.107.56.29)结论在本研究中,我们使用血红蛋白病作为范例,来建立LOVD-中国突变数据库和DASH系统,因为血红蛋白病是全世界最常见的单基因疾病,并且与致病基因以及修饰基因中各种突变的组合都息息相关。带有DASH系统的LOVD-中国数据库是第一个血红蛋白病自动辅助诊断平台,为血红蛋白病的筛查,诊断和预防提供了一个标准。这两个网站将随着分子筛选,传统诊断方法和临床医生提交的数据而不断的维护和更新。我们希望LOVD-DASH能成为遗传疾病在线诊断的范例,并可能成为诊断和筛查其他遗传疾病的灵感来源。在这项研究中,我们描绘了中国人群中血红蛋白病最全面的突变谱。此外,LOVD-DASH将为研究和临床应用做出贡献,并为中国患者的血红蛋白病的治疗和预防提供新的方法。通过LOVD数据库和DASH系统,我们距离实现完备的分子筛选和进行血红蛋白病精确诊断更近了一步。