论文部分内容阅读
目的:DNA甲基化是指在基因组DNA中胞嘧啶第5位碳原子发生甲基共价修饰,其主要发生在CpG二核苷酸。作为表观遗传学的重要研究内容之一,它在调节细胞的分化增殖、人体生命活动中发挥着重要作用。同卵双生子(monozygotic twins, MZ)是由一个受精卵在内在和外在因素的共同作用下,发育为两个完全独立的个体,因此同卵双生两个体的遗传背景完全相同,享有共同的DNA序列。在法医DNA分析领域,现有的DNA遗传分析系统理论上可以识别除同卵双生子外的所有个体。然而,对于遗传DNA序列完全相同的同卵双生个体,现有的DNA分析手段尚不能有效鉴别。目前,众多对于同卵双生子表观遗传学的研究都已证实,同卵双生子无论在整个表观遗传组水平还是对于特异位点都存在着表观遗传的差异,而且每一个体的表观遗传水平在生命的每个阶段也是呈现一种动态变化过程。本研究采用甲基化免疫共沉淀结合高通量测序的方法(methylated DNA immunoprecipitation sequencing,MeDIP-seq),探索在新生儿同卵双生子的DNA甲基化谱分布特点及其之间的差异,并且寻找到若干普遍存在的差异位点,为在表观遗传水平建立同卵双生子识别系统提供基础。方法:收集5对双胞胎新生儿脐带血,应用DP-318血液基因组DNA提取试剂盒(天根生化科技有限公司)提取血液基因组DNA,用Identifiler?试剂盒检测15个常染色体STR基因座分型,选择分型完全相同的1对同卵双生子DNA样本,应用MeDIP-seq方法进行甲基化谱分析。首先用超声将DNA随机打断至100~500bp,进行DNA末端修复,3’末端加上“A”碱基及测序接头;然后将双链DNA变性为单链,用5-mC抗体沉淀,MeDIP沉淀产物进行qPCR验证,随后进行纯化及扩增,选择200-300bp的片段进行TA克隆、SOLEXA测序。将测序结果与参考基因组比对,可唯一比对的序列用于后续的信息分析,包括reads统计与分布,MeDIP-seq序列富集区域(peak)的信息分析,peak水平的差异分析,peak区域基因本体(gene ontology, GO)分析。根据分析结果,从中选择适合于法医DNA分析的DNA甲基化差异位点,作为后续研究的候选位点。结果:1基本生物信息分析:对于此对同卵双胞胎的MeDIP测序,各获得3.6G数据,包含有73,469,388条reads,每条reads读长为49bp。将这些reads与参考基因组比对,两样本分别获得65,207,711条和65,579,985条reads,分别占总reads的88.75%和89.26%,其中可唯一比对的reads分别为48,754,692和50,069,020条,分别占可比对数目的74.77%和76.35%。基因组覆盖率分别为33.25%和38.76%,覆盖深度分别为3.22和2.76。统计可唯一比对reads在基因各功能元件分布,发现在各功能元件均有分布但分布不均,以重复区域分布最多。统计在各重复区域的分布,发现在多个重复区域均有分布,然而在短散在重复序列/Alu序列分布最多。2 MeDIP-seq序列富集区域(Peak)信息分析:统计可唯一比对reads的富集区域(peak),各得到257,362条和197,272条peak,基因组覆盖率达到6.53%和5.29%。统计这些peak在各长度区间的分布,发现两样本均在600700bp长度区间拥有最多的peak,并且虽然在各长度区间分布趋势相似,然而数目却有所不同。统计peak在各基因功能元件分布,发现peak在各基因功能元件的统计发现两样本在各元件均有分布,但均以internal introns分布最多。对这些peak相关基因进行GO功能注释分析,发现在GO的三项功能条目中均有分布但分布不均。3 DNA甲基化差异序列分析:在基因相关区域统计两样本间差异基因功能元件,共得到477个差异基因功能元件。对这些寻找到的基因功能元件进行GO功能富集发现这些差异基因在GO的三个分支中均有分布,只是分布水平不同。在全基因组范围内寻找具有显著差异的区域,共找到2205条存在DNA甲基化差异的序列,其中595条位于基因区域,1610条位于基因间区。从这些差异片段中,我们最终选出113个片段作为后续分析的候选位点结论:1本研究首次应用MeDIP-seq的方法检测一对新生儿同卵双生个体DNA甲基化谱系特征,并进行差异位点的筛选,找到2205条存在DNA甲基化差异的序列,其中595条位于基因区域,1610条位于基因间区。2初步证实了DNA甲基化鉴别同卵双生个体的可行性,并从上述差异序列中筛选出113个甲基化差异区域作为法医DNA分析的候选位点,为后续鉴别同卵双生个体的研究提供了思路和基础。