法医个体识别微单倍型标记的筛选及NGS检测体系的建立

来源 :河北医科大学 | 被引量 : 0次 | 上传用户:hznmtz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:微单倍型(microhaplotype,MH)是近年研究发现的新型遗传标记,位于非重组热区,是指200bp范围内2-5个单核苷酸多态性(single nucleotide polymorphism,SNP)位点的组合,兼具短串联重复(short tandem repeats,STR)和SNP的优点,如片段短、突变率低、多态性良好、含有祖先信息等,且无二者的缺点如STR的stutter峰、SNP无法用于混合检材等,是具有极大潜力的法医学遗传标记。目前对其的研究尚处于起步阶段,本课题拟筛选适合中国人群的微单倍型基因座,应用下一代测序技术(next generation sequencing,NGS)构建检测体系,评估体系的法医学应用价值,为法医学个体识别和亲缘鉴定提供新的遗传标记及技术方案。方法:从千人基因组数据库筛选出在汉族人群中杂合度大于0.4的SNP位点,以位于非重组热区、200bp内有2-5个SNP作为标准筛选微单倍型基因座。以筛选出的基因座为核心内容,构建微单倍型数据库网站。并且从筛选出的基因座中选择12个位于常染色体、杂合度大于0.7、等位基因频率均衡的基因座构建二代测序复合体系。提取河北汉族人群外周血DNA,用QIA Targeted DNA Custom Panel构建文库,主要包括5个步骤:基因组DNA片段化、末端修饰;连接DNA接头并纯化;靶向富集并纯化;常规PCR及PCR产物清洗;文库定量。将文库等体积混合、稀释和变性后,在MiSeq FGx平台进行测序。用BWA等计算机程序处理原始数据,获得基因分型结果,评估体系。并且用同一样本分别构建的3个文库进行重复性研究;用同一样本以20 ng、10 ng、5 ng、2.5 ng、1.25 ng的DNA模版起始量进行灵敏度研究。用无关个体的分型数据调查河北汉族人群的群体遗传学数据,为该体系的应用提供基础。用检测的家系样本计算亲权指数,进行实际案例应用。结果:1.微单倍型的命名我们提出了一种微单倍型的命名方法,由五个部分组成。以mh02-174285354/400/461为例,“mh”为微单倍型简称以区分不同遗传标记,“02”为该基因座位于2号染色体上,“174285354”为基因座第一个SNP在染色体上的位置,“672/733”分别表示第二个和第三个SNP染色体位置的后几位数字。2.测序数据的实验室评价54个被测样本的覆盖深度都在500×以上,最高为2198×,最低为518×,所有样本的平均DoC为1391×。在对测序结果分析前,我们设定了分析阈值,判定reads数大于总reads数20%的序列为有效序列,低于总reads数20%的序列为无效序列。结果显示,所有基因座的有效reads数均大于总reads数的80%。在此基础上,对54个样本的12个基因座的测序数据进行质量分析。基因座的平均覆盖度结果显示,每个基因座的平均覆盖度都在600×以上,12个基因座的平均覆盖度为1379±1218×(mean±2SD),最低覆盖度为628×,其中2个基因座覆盖度大于mean±2SD。基因座序列组分构成比(%allele、%noise)结果显示,%allele最低为84.11%,最高为98.96%。所有基因座平均%allele为93.98%,除3个基因座外,其余基因座%allele均大于90%;基因座%noise最低为1.04%,最高为15.89%,所有基因座平均%noise为6.0%。杂合性均衡比最低为0.683±0.250,最高为0.876±0.160,所有基因座的平均Hb为0.738±0.06。在12个基因座中,两个基因座的平均杂合性均衡比在0.60.7之间,其余10个基因座的平均杂合性均衡比均大于0.7。3.重复性研究使用同一样本构建的3个文库测序结果显示,3次重复测序的等位基因分型结果一致。每个文库3次重复%allele(P=0.43)和ACR(P=0.56)均无显著性差异。4.灵敏度研究当DNA模版量为20 ng、10 ng、5 ng时,测序数据均无显著性,随着起始模版量的降低,ACR呈下降趋势,变异系数CV值呈上升趋势,基因座等位基因间不均衡性增强。当DNA模版量为1.25 ng时,3个基因座出现等位基因丢失。5.法医学参数该体系包括12个微单倍型基因座,每个基因座包含24个SNP位点。在46个无关个体中,各基因座分别检测出314种等位基因。总体上,随着SNP位点数量的增多,等位基因数量呈增长趋势。对46个无关个体分型数据进行群体遗传学参数分析,经Bonferroni校正,所有基因座的等位基因频率分布均符合Hardy-Weinberg平衡,各基因座均呈连锁平衡状态。12个基因座的Ho为0.5000.935,平均为0.789,He范围为0.5050.858,平均为0.758,10个基因座的Ho大于0.7,具有高度遗传多态性;PIC范围为0.3750.835,平均值为0.705;DP为0.5250.964,8个基因座的DP大于0.9,12个基因座的TDP为0.999999999999811;PEduo值为0.1250.550,CPEduo为0.99755;PEtrio值为0.1870.712,CPEtrio为0.99995。在12个基因座中,10个基因座Ae值大于3.0,5个基因座Ae值大于5.0,2个基因座Ae值大于6.0。用4个Ae>5.0的基因座检测样本时,理论上有99.84%的可能性检测出该样本为两样本混合物。6.实际案例应用应用构建的微单倍型分型体系检测两个家系样本。结果显示,父(母)-子中至少有一个相同的等位基因,没有发生突变或重组。12个基因座三联体CPE为0.99995,系统效能满足鉴定标准,在7个三联体家系中,累积父权指(combined paternity index,CPI)平均值为12741,最大值为54477.9784,最小值为1472.2114,两个家系CPI大于10000,达到认定标准,其余家系CPI均在0.000110000之间。在家系的二级亲缘关系中计算了祖孙/叔侄关系对的累积祖孙指数CGI。在无亲本参考条件下,9对祖孙/叔侄CGI范围为0.11817.072,平均值为5.804;9对无关个体的CGI范围为0.0300.882,平均值为0.415,其中有2对祖孙/叔侄的CGI落在无关个体范围内。在生母做参考样本条件下,9对祖孙/叔侄的CGI范围为0.05184.048,平均值为17.579,9对无关个体CGI范围为0.0080.407,平均值为0.158,仅1对祖孙与无关个体CGI范围有交叉。7.微单倍型数据库建设我们从千人基因组数据中CHB和CHS的22条常染色体上的SNP进行筛选,按照预设条件共筛选出245479个微单倍型基因座,使用PHASE估算基因座单倍型、单倍型频率及杂合度。以筛选出的数据为核心内容,建立了适用于中国人群的微单倍型数据库网站:MPHDatabase 1.0(http://www.ehbio.com/MPH/),实现微单倍型数据的共享与搜索。结论:筛选出在中国汉族人群中具有较高多态性和良好均衡性的245479个微单倍型基因座,建立中国汉族人群微单倍型数据库;构建了12个微单倍型基因座的NGS分型体系和分析方法,分型体系具有较好的灵敏度和重复性,获得了该12个基因座在河北汉族人群的群体遗传学数据,为法医学应用奠定基础。
其他文献
目的:本临床试验研究,是对清热祛湿利水方治疗湿热蕴结型痛风性关节炎的临床疗效及安全性做出客观的评价。方法:本研究采用随机临床研究的设计,本课题共收集符合纳入标准的湿热蕴结型痛风性关节炎患者72例,治疗组36例,对照组36例。治疗组采用清热祛湿利水方,水煎服,早晚各服1次,每天1剂,连续治疗7天;对照组采用痛风定胶囊,口服治疗每次4粒,每日3次,连续治疗7天。记录两组治疗前后的VAS评分、中医症候积
本文系统论述了炼化生产装置DC S黑屏操作,详细介绍了具备D C S黑屏操作的基础 条件,指出了 DCS黑屏事故应急处理预案.同时,强调了 P ID 参数整定的重要性,介绍了先进 控制与
采用回流法以KMn O4和Mn SO4为前驱体,硫酸亚铁铵[(NH4)2Fe(SO4)2]为铁源,制备出Fe掺杂的Mn O2纳米棒。通过X射线衍射仪、扫描电子显微镜对样品的结构和形貌进行表征,并使用循环
定义了不均匀沙有别于均匀沙的起动概念,得出了不均匀沙中各粒径沙具有不同的流体起动风速,且不等于对应粒径均匀沙流体起动风速的结论,具体表现为:不均匀沙中小粒径沙的流体起动
目的探讨无痛胃镜在高位食道异物取出术中的应用价值。方法术前经 X 线胸片等确定异物在食道颈部或胸部以上,普通胃镜取出困难,采用丙泊酚做静脉全身麻醉,待患者各种反射消失
针对三维地质建模中数据繁多、建模参数选取及地层建立过程复杂等问题,采用C#程序语言结合Auto CAD和CATIA进行二次开发,提取并归类数据,同时借助CATIA强大的建模功能,建立地
补写型连贯题是近年来高考语文全国卷的必考题型。从表面上看,此题型考查的是学生语言组织和表达能力,实质上是检测学生的思维能力。鉴于此,指导学生从语段中寻觅出可以体现
哈萨克斯坦独立后,大力吸引外国直接投资成为了其融入经济全球化的重要步骤。十余年来,哈方在吸引外国直接投资方面取得了令人瞩目的成就。外国直接投资对促进哈方国内经济快速
针对均值漂移算法理论的不足,提出了一种改进的均值漂移算法。首先利用卡尔曼滤波获得跟踪目标的初始位置。然后在均值漂移跟踪算法中自适应地调整核函数的带宽,利用均值漂移
随着光伏发电的技术越来越成熟,成本逐渐降低,光伏发电系统作为主动式节能被大量的运用到建筑中。然而,由于建筑本身及其环境控制系统的复杂性,单凭设计师的经验和简单的计算