论文部分内容阅读
随着DNA遗传标记的广泛使用,除了常见的三联体、二联体亲子鉴定案件外,还会遇到祖孙和/或叔侄关系等复杂亲缘关系认定的案件,这些血缘关系的鉴定更多的出现在诸如认亲、失踪人口调查、大规模灾难事件的遗骸认定、继承、移民等事件中。近年来,此类案件有增多的趋势,而目前对此类复杂亲缘关系的判定研究尚少,更缺乏相应的判定标准。对于复杂的亲缘关系鉴定,不同的遗传标记,因具有不同的遗传特性也在不同类型的亲缘关系鉴定中发挥优势。相对于传统的毛细管电泳分型技术,运用二代测序技术,可同时获得短串联重复(short tandem repeat, STR)、单核苷酸多态性(single nucleotide polymorphism, SNP)等多种类型的大量的遗传标记信息,不但可以得到包含STR基因座侧翼序列和核心重复单位的完整序列,能够鉴别长度相同的等位基因之间的序列差异,发现同等位基因(Isoallele),而且具有高通量、低成本、快速的优点,在法医遗传学中有非常可观的应用前景。
本研究拟通过采集祖孙和/或叔侄类复杂亲缘关系家系样本,应用高通量下一代测序技术MiSeq?FGx?测序平台及ForenSeqTMDNASignaturePrepKit,同时对多种遗传标记进行检测分型。在对该方法进行实验室评估验证其准确性的基础上,分别对祖孙和/或叔侄类复杂亲缘关系样本进行检测,获得其DNA分型结果。依据遗传关系、数理统计原理和函数运算,计算累积亲权指数(cumulative paternity index, CPI)CPI和状态一致性(identity by state, IBS)等参数,比较无关个体与祖孙和/或叔侄关系CPI及IBS,推算认定与否定祖孙和/或叔侄关系CPI和IBS状态阈值,并评估阈值的风险。通过解决此类复杂亲缘关系鉴定的理论问题,为制定祖孙和/或叔侄复杂亲缘关系鉴定的标准规范提供科学依据。
第一部分复杂亲缘关系样本的采集及验证研究
目的:收集祖孙和/或叔侄亲缘关系样本,并从遗传学角度验证所采集样本之间的亲缘关系。
方法:
1样本采集:按照知情同意原则,采集河北省沧州市泊头镇王青村、吴振岗村、丰果村49个家系共计227个个体新鲜血液(5ml)样本;
2DNA提取及定量:使用E.Z.N.A.DNABloodMidikit提取血液样本基因组DNA,使用核酸定量仪进行提取样本的DNA定量;
3DNA分型:使用GoldeneyeTM20A试剂盒对上述DNA样本进行PCR扩增,包括19个STR基因座及Amelogenin性别鉴定基因座,ABI3130遗传分析仪对PCR产物进行毛细管电泳获得DNA分型;
4亲权指数计算:对每一个样本配对进行PI和FSI计算。
结果:
1DNA分型结果:227个样本均获得完整清晰的毛细管电泳分型结果,在所检样本中分别发现PentaE和D21S11两个基因座的稀有等位基因,经计算分别命名为等位基因15.2、28和30.3;
2根据计算结果,排除部分祖孙、叔侄关系,对确定全同胞关系的家系进行合并,最终确定有亲缘关系的家系29个,父母缺如的家系因遗传信息不全不能确定其亲缘关系。
小结:根据CPI及CFSI结果,结合样本采集和村民关系调查信息,确定54对祖孙关系和43对叔侄关系。
第二部分ForenSeqTMDNASignaturePrepKit人类个人识别系统的分型检测研究
目的:对MiSeq?FGx?测序平台及ForenSeqTMDNASignaturePrepKit进行实验室检测,评估该系统的准确性、与毛细管电泳技术的一致性。
方法:
1测序:使用ForenSeqTMDNASignaturePrepKit对第一部分确认亲缘关系的家系样本进行文库构建,应用MiSeq?FGx?测序平台进行测序;
2数据分析:与第一部分CE结果比对,分析两种分型方法的差异,对27个常染色体STR基因座中LB,SB,FB的分型结果和94个常染色体SNPs中SNP和SNP+进行同等位基因的统计分析;
3测序数据评估:对检测样本进行样本平均覆盖深度、基因座平均覆盖深度、基因座平均覆盖度构成比、杂合性均衡等质量评估。
结果:
1测序结果:通过两种检测分型方法,确认了第一部分发现的稀有等位基因,MiSeq?FGx?测序系统的分析软件UAS在对等位基因的命名判读较为准确,证实在实验条件控制较好的前提下,MiSeq?FGx?测序平台的测序结果稳定、准确且测序命名可靠;
2数据分析:在校正过stutter后,LB结果在分型准确性上高达99.86%,根据突变部位不同(SB和FB),共发现16个基因座出现累计150和167个同等位基因,其中新增等位基因数目最多的等位基因为基因座D21S11等位基因30,增加了6个;新增等位基因最多的基因座是D12S391,增加了25个;
3遗传标记评价:通过实验我们发现常染色体STR中基因座D22S1045和PentaE,Y-STR基因座DYS392和DYS612,X-STR基因座DXS10103以及常染色体SNPs位点中rs1294331、rs1357617、rs4606077、rs7041158、rs2920816、rs2342724、rs1736442、rs719366和rs1031825在本实验中分型结果较差,不同程度出现杂合比差异较大、dropout、高stutter和无法检测或解读分型的问题;
4测序数据质量评估:
1)DoC:样本DoC最高达245555,最低为52741;其中STRs总覆盖深度最高为180609,最低为17897;SNPs总覆盖深度最高为71523,最低为13039;所有样本总体覆盖深度的均数和标准差为134129?45070;DYS392基因座的平均DoC离散程度最大,不稳定性最高,SNP位点rs4530059平均DoC水平在SNP中具有较高的不稳定性,但SNP整体质量较STR更高;
2)SCR:基因座DYS612和DYS481的等位基因覆盖深度最低,PentaD等位基因覆盖率最高;
3)ACR:最高的STR为D21S11基因座,为0.874,基因座D22S1045的平均杂合比最低,仅为0.41,SNPs位点rs6955448的平均杂合比最低,为0.422,最高为位点rs251934,为0.878;
小结:
1应用MiSeq?FGx?系统平台及ForenSeq?DNASignaturePrep试剂盒,对检测样本进行测序分型,通过对覆盖深度、杂合性均衡比、分型构成比等指标的分析,证实MiSeq?FGx?系统平台及ForenSeq?DNASignaturePrep试剂盒在我室具有较好的分型表现和可靠稳定的质量保证;
2应用MiSeq?FGx?系统平台可得到较多基因座的同等位基因和等位基因突变结果,同等位基因的出现为等位基因分型的解读提供了更多的差异信息,可为进行法医学个人识别和亲权鉴定提供更高的个人识别能力。
第三部分祖孙和/或叔侄关系的理论鉴定阈值及风险评估研究
目的:推算祖孙关系和/或叔侄关系的判定阈值,对阈值进行验证评估。
方法:
1基础数据计算:将111个样本进行祖孙和/或叔侄关系和无关个体对两组,分别进行CPI、IBS的计算;
2阈值确定:使用数理理论和统计软件,分别应用基于经典ITO法和判别分析法进行判定阈值的计算;
3阈值评价:使用SPSS21.0软件对上述统计的基础数据进行正态分布、t-检验、Fisher检验和LOOCV,使用主要评价指标分别进行验证。
结果与小结:
1基于ITO法计算CPI值,设置CLR>1和CLR<0.1作为121个LB-SNP基因座的系统认定和排除祖孙和/或叔侄关系的阈值,且在此情况下,其判定准确度高于95%;
2基于判别分析法法计算IBS值,经校正计算后,认定阈值表述为IBS-7.5A0>35.5,排除阈值为IBS-7.5A0<-4,该情况下在FB+SNP系统中存在最大准确度,且准确度为86.1%。
结论:
1对MiSeq?FGx?测序平台及ForenSeq?SignaturePrep试剂盒的评估表明,该检测系统在本实验室展现良好的稳定性和一致性;较传统的CE技术能够同时获得更多基因座分型结果,并能检测到STR基因座更多的同等位基因,大大提高个体识别及亲缘关系鉴定的系统效能;
2基于ITO法计算CPI值,设置CLR>1和CLR<0.1作为121个LB-SNP基因座的系统认定和排除祖孙和/或叔侄关系的阈值,且在此情况下,其判定准确度高于95%;基于判别分析法法计算IBS值,经校正计算后,认定阈值表述为IBS-7.5A0>35.5,排除阈值为IBS-7.5A0<-4,该情况下在FB+SNP系统中存在最大准确度,且准确度为86.1%;
3使用MiSeq?FGx?测序平台及ForenSeq?SignaturePrep试剂盒对河北汉族人群的祖孙和/或叔侄关系进行的检测结果提示,NGS可以为解决复杂亲缘关系案件提供一个遗传信息全面、准确度较高的新思路。
本研究拟通过采集祖孙和/或叔侄类复杂亲缘关系家系样本,应用高通量下一代测序技术MiSeq?FGx?测序平台及ForenSeqTMDNASignaturePrepKit,同时对多种遗传标记进行检测分型。在对该方法进行实验室评估验证其准确性的基础上,分别对祖孙和/或叔侄类复杂亲缘关系样本进行检测,获得其DNA分型结果。依据遗传关系、数理统计原理和函数运算,计算累积亲权指数(cumulative paternity index, CPI)CPI和状态一致性(identity by state, IBS)等参数,比较无关个体与祖孙和/或叔侄关系CPI及IBS,推算认定与否定祖孙和/或叔侄关系CPI和IBS状态阈值,并评估阈值的风险。通过解决此类复杂亲缘关系鉴定的理论问题,为制定祖孙和/或叔侄复杂亲缘关系鉴定的标准规范提供科学依据。
第一部分复杂亲缘关系样本的采集及验证研究
目的:收集祖孙和/或叔侄亲缘关系样本,并从遗传学角度验证所采集样本之间的亲缘关系。
方法:
1样本采集:按照知情同意原则,采集河北省沧州市泊头镇王青村、吴振岗村、丰果村49个家系共计227个个体新鲜血液(5ml)样本;
2DNA提取及定量:使用E.Z.N.A.DNABloodMidikit提取血液样本基因组DNA,使用核酸定量仪进行提取样本的DNA定量;
3DNA分型:使用GoldeneyeTM20A试剂盒对上述DNA样本进行PCR扩增,包括19个STR基因座及Amelogenin性别鉴定基因座,ABI3130遗传分析仪对PCR产物进行毛细管电泳获得DNA分型;
4亲权指数计算:对每一个样本配对进行PI和FSI计算。
结果:
1DNA分型结果:227个样本均获得完整清晰的毛细管电泳分型结果,在所检样本中分别发现PentaE和D21S11两个基因座的稀有等位基因,经计算分别命名为等位基因15.2、28和30.3;
2根据计算结果,排除部分祖孙、叔侄关系,对确定全同胞关系的家系进行合并,最终确定有亲缘关系的家系29个,父母缺如的家系因遗传信息不全不能确定其亲缘关系。
小结:根据CPI及CFSI结果,结合样本采集和村民关系调查信息,确定54对祖孙关系和43对叔侄关系。
第二部分ForenSeqTMDNASignaturePrepKit人类个人识别系统的分型检测研究
目的:对MiSeq?FGx?测序平台及ForenSeqTMDNASignaturePrepKit进行实验室检测,评估该系统的准确性、与毛细管电泳技术的一致性。
方法:
1测序:使用ForenSeqTMDNASignaturePrepKit对第一部分确认亲缘关系的家系样本进行文库构建,应用MiSeq?FGx?测序平台进行测序;
2数据分析:与第一部分CE结果比对,分析两种分型方法的差异,对27个常染色体STR基因座中LB,SB,FB的分型结果和94个常染色体SNPs中SNP和SNP+进行同等位基因的统计分析;
3测序数据评估:对检测样本进行样本平均覆盖深度、基因座平均覆盖深度、基因座平均覆盖度构成比、杂合性均衡等质量评估。
结果:
1测序结果:通过两种检测分型方法,确认了第一部分发现的稀有等位基因,MiSeq?FGx?测序系统的分析软件UAS在对等位基因的命名判读较为准确,证实在实验条件控制较好的前提下,MiSeq?FGx?测序平台的测序结果稳定、准确且测序命名可靠;
2数据分析:在校正过stutter后,LB结果在分型准确性上高达99.86%,根据突变部位不同(SB和FB),共发现16个基因座出现累计150和167个同等位基因,其中新增等位基因数目最多的等位基因为基因座D21S11等位基因30,增加了6个;新增等位基因最多的基因座是D12S391,增加了25个;
3遗传标记评价:通过实验我们发现常染色体STR中基因座D22S1045和PentaE,Y-STR基因座DYS392和DYS612,X-STR基因座DXS10103以及常染色体SNPs位点中rs1294331、rs1357617、rs4606077、rs7041158、rs2920816、rs2342724、rs1736442、rs719366和rs1031825在本实验中分型结果较差,不同程度出现杂合比差异较大、dropout、高stutter和无法检测或解读分型的问题;
4测序数据质量评估:
1)DoC:样本DoC最高达245555,最低为52741;其中STRs总覆盖深度最高为180609,最低为17897;SNPs总覆盖深度最高为71523,最低为13039;所有样本总体覆盖深度的均数和标准差为134129?45070;DYS392基因座的平均DoC离散程度最大,不稳定性最高,SNP位点rs4530059平均DoC水平在SNP中具有较高的不稳定性,但SNP整体质量较STR更高;
2)SCR:基因座DYS612和DYS481的等位基因覆盖深度最低,PentaD等位基因覆盖率最高;
3)ACR:最高的STR为D21S11基因座,为0.874,基因座D22S1045的平均杂合比最低,仅为0.41,SNPs位点rs6955448的平均杂合比最低,为0.422,最高为位点rs251934,为0.878;
小结:
1应用MiSeq?FGx?系统平台及ForenSeq?DNASignaturePrep试剂盒,对检测样本进行测序分型,通过对覆盖深度、杂合性均衡比、分型构成比等指标的分析,证实MiSeq?FGx?系统平台及ForenSeq?DNASignaturePrep试剂盒在我室具有较好的分型表现和可靠稳定的质量保证;
2应用MiSeq?FGx?系统平台可得到较多基因座的同等位基因和等位基因突变结果,同等位基因的出现为等位基因分型的解读提供了更多的差异信息,可为进行法医学个人识别和亲权鉴定提供更高的个人识别能力。
第三部分祖孙和/或叔侄关系的理论鉴定阈值及风险评估研究
目的:推算祖孙关系和/或叔侄关系的判定阈值,对阈值进行验证评估。
方法:
1基础数据计算:将111个样本进行祖孙和/或叔侄关系和无关个体对两组,分别进行CPI、IBS的计算;
2阈值确定:使用数理理论和统计软件,分别应用基于经典ITO法和判别分析法进行判定阈值的计算;
3阈值评价:使用SPSS21.0软件对上述统计的基础数据进行正态分布、t-检验、Fisher检验和LOOCV,使用主要评价指标分别进行验证。
结果与小结:
1基于ITO法计算CPI值,设置CLR>1和CLR<0.1作为121个LB-SNP基因座的系统认定和排除祖孙和/或叔侄关系的阈值,且在此情况下,其判定准确度高于95%;
2基于判别分析法法计算IBS值,经校正计算后,认定阈值表述为IBS-7.5A0>35.5,排除阈值为IBS-7.5A0<-4,该情况下在FB+SNP系统中存在最大准确度,且准确度为86.1%。
结论:
1对MiSeq?FGx?测序平台及ForenSeq?SignaturePrep试剂盒的评估表明,该检测系统在本实验室展现良好的稳定性和一致性;较传统的CE技术能够同时获得更多基因座分型结果,并能检测到STR基因座更多的同等位基因,大大提高个体识别及亲缘关系鉴定的系统效能;
2基于ITO法计算CPI值,设置CLR>1和CLR<0.1作为121个LB-SNP基因座的系统认定和排除祖孙和/或叔侄关系的阈值,且在此情况下,其判定准确度高于95%;基于判别分析法法计算IBS值,经校正计算后,认定阈值表述为IBS-7.5A0>35.5,排除阈值为IBS-7.5A0<-4,该情况下在FB+SNP系统中存在最大准确度,且准确度为86.1%;
3使用MiSeq?FGx?测序平台及ForenSeq?SignaturePrep试剂盒对河北汉族人群的祖孙和/或叔侄关系进行的检测结果提示,NGS可以为解决复杂亲缘关系案件提供一个遗传信息全面、准确度较高的新思路。