论文部分内容阅读
目的:目前,短串联重复序列(Short tandem repeat,STR)由于具有高多态性的特点,是法医DNA检测领域中个人识别和亲子鉴定主流的遗传标记。使用的大多数STR商业试剂盒中所包含独立STR基因座在鉴定爷孙、叔侄和半同胞这三种同属二级的亲缘关系时,计算得到的似然率是相同的,因此不能使用亲子鉴定的常用独立STR基因座鉴定此类同级亲缘关系的复杂亲缘关系鉴定。近年来,在同级亲缘关系的研究中,使用连锁常染色体STR基因座无论是在理论计算上还是通过构建基于毛细管电泳STR分型技术都有相关研究,但是仍然不能满足实际需求。大规模平行测序技术(Massively parallel sequencing,MPS)技术既可检测大量STR基因座,又可分析多个DNA样本。本研究基于MPS构建了一个常染色体连锁STR基因座的分型体系,并建立一套MPS测序数据的分析流程及方法,通过对体系的法医学评估和群体遗传学及相关法医学参数的分析,并通过Merlin软件模拟生成爷孙、叔侄、半同胞和全同胞各10000对亲缘关系对得到他们的分类分数,为复杂亲缘关系鉴定领域中同级亲缘关系鉴定研究提供新的检测方法与初步研究的数据。方法:(1)MPS体系的构建:按照一定的标准从Rutgers Map v3遗传图谱中筛选出66组173个常染色体连锁STR基因座,接下来在AIdesign探针/引物设计平台上对STR目的片段进行引物设计且STR基因座的片段长度范围在150bp~270bp并开发多重PCR靶向捕获扩增的分型体系。(2)MPS文库构建及测序:使用QIAamp~?DNA Investigator试剂盒提取110个北方汉族无关个体血卡样本DNA,QIAGEN DNeasy Blood&Tissue试剂盒提取家系样本血液DNA,将DNA样本使用MultipSeq?Custom Panel试剂盒进行MPS文库构建,使用Qubit4.0与QuantStudio 5实时荧光定量PCR仪对文库进行定量,并使用Qsep100全自动核酸蛋白分析系统进行文库的质量控制,最后将合格的文库在Illumina MiSeq FGx测序平台上进行测序。(3)MPS数据分析:使用FASTQC软件对样本fastq文件进行测序质量的评估,然后使用STRaitRazor 3.0软件对样本进行STR基因座分型,然后使用本实验室建立的MPS数据分析流程对相关数据提取,最后对数据进行可视化处理。(4)体系的法医学评估:随机选择2个样本进行同一批次3次文库构建及3次不同批次的文库构建的重复性研究和随机选择体系中的20个STR基因座进行单基因座扩增并进行Sanger测序的准确性实验;使用9948标准品DNA准备DNA投入量为10ng,5ng,2.5ng,1ng,0.5ng,0.25ng,0.125ng的文库进行灵敏性研究;将9947A与9948标准品DNA以1:1,1:2,1:4,1:9,2:1,4:1和9:1混合后进行不同比例混合样本研究;使用猪,狗,牛,羊,鸡,兔,鼠7种动物样本DNA进行种属特异性研究实验;对110个北方汉族无关个体的DNA进行STR基因座的法医学参数学分析。(5)家系样本分析:使用4组包含爷爷,奶奶,父亲,母亲和孩子五个人的家系样本进行各紧密连锁的STR组合的分析;使用Merlin软件模拟生成爷孙,叔侄,半同胞和全同胞四种亲缘关系对各10000对,接下来使用Merlin软件分别计算各亲缘关系对及假设亲缘关系对的似然率值,最终使用分类分数评估该体系对爷孙、叔侄、半同胞和全同胞亲缘关系对之间的区分能力。结果:(1)文库质量控制:文库片段长度在310~400bp范围,既无小片段的引物二聚体也没有大片段的尾峰;随DNA投入量增加相对荧光单位值(Relative fluorescence unit,RFU)和文库浓度随之提高;样本测序数据fastq文件质控在Q30以上的碱基可达到98%以上。(2)MPS数据分析:样本总覆盖深度平均为302393×,主峰占比平均为0.8255;173个STR基因座覆盖深度平均为2617×;110个无关个体173个基因座中共检测到14759个杂合子,其等位基因杂合均衡比平均为0.881;110个无关个体173个STR基因座序列组成比中Allele%,Stutter%和Noise%平均值分别为83.0%,4.4%,12.6%。(3)法医学评估:同一批次与不同批次测序参数结果相近且STR基因座的分型一致,随机选取的20个STR基因座进行单基因座扩增后进行MPS测序分型结果和Sanger测序验证的结果与多重PCR靶向捕获测序体系的分型结果是一致;当DNA投入量小于2.5ng时,Allele%逐渐减少,且在小于0.25ng时出现STR基因座的丢失;当9947A与9948混合比例在1:4,1:9,或4:1,9:1时,混合样本中次要占比的样本的STR分型将很难区分是Stutter和其他杂峰,还是其真正的分型;Hardy-Weinberg平衡检验所得到的p值Boniferroni校正后有8个STR基因座的等位基因频率不符合Hardy-Weinberg平衡,分别是D1S1660,D5S1473,D5S1459,D6S1284,D15S644,D11S1983,D13S1492和D20S1146;各STR基因座的遗传多态性,多态性信息含量,个人识别能力及杂合度观察值均表现较好。(4)家系样本分析:4组包含爷爷,奶奶,父亲,母亲,孩子的家系样本的分型结果和遗传关系表明,66组STR连锁群分别均呈紧密连锁;使用分类分数评估173个STR基因座对爷孙、叔侄、半同胞以及全同胞亲缘关系对之间的区分能力,结果表明,爷孙、叔侄、半同胞和全同胞亲缘关系对的分类分数分别为0.7247,0.5276,0.2154,0.9954,换句话说正确率爷孙为72.47%,叔侄为52.76%,半同胞为21.54%,全同胞为99.54%。结论:本研究基于MPS技术建立了一个包含173个常染色体连锁STR的复合PCR靶向捕获扩增分型体系和分析方法;该体系具有种属特异性好、灵敏度1ng、准确性与重复性较好、混合物检出能力较好的法医学性能指标验证结果;具有较好区分爷孙、叔侄、半同胞以及全同胞亲缘关系对的能力,可初步为复杂亲缘关系鉴定中的同级亲缘关系的鉴定提供新的检测方法与分析思路。但是由于本体系遗传标记数量的不足和计算方法上仍有不完善,而不能使分类的准确率达到一个较为理想的值,仍需进一步改进优化。