论文部分内容阅读
目的:同卵双生个体(monozygotic twin,MZT)的鉴别在法医DNA分型领域仍是一个未解难题,当一些案件确定MZT为犯罪嫌疑人或被控父时,尚无科学可行的DNA检验手段将其有效甄别,不能为案件的侦破提供有价值的证据线索,是当前法医物证学领域亟待解决的难题。尽管目前有些研究发现,MZT之间也存在基因序列的差异,比如拷贝数变异(copy number variation,CNV)的差异、SNP差异或DYZ1基因差异,但是这种差异在表型一致的MZT之间很罕见,在MZT之间寻找这样的基因序列差异如同大海捞针。而另一种遗传标记DNA甲基化也许能够提供更多的差异信息用于MZT的区分。目前已有大量研究表明无论表型存在差异的MZT,如肥胖症、精神疾病或癌症的差异,还是表型一致的MZT,二者之间都存在基因组范围或基因特异的甲基化差异,为DNA甲基化用于区分MZT个体提供了有利的理论依据。本研究拟应用甲基化免疫共沉淀(methylated DNA immunopreci-pitation,Me DIP)测序技术,检测4对不同年龄的表型一致的MZT个体全基因组甲基化谱,从全基因组水平筛选出4对MZT共有的甲基化差异区域,作为区分MZT个体的候选序列。方法:按照知情同意原则,采集了4对同卵双生子外周血样本,每位受试者均签署知情同意书并填写了相应的调查问卷。应用QIAamp DNA Blood kit(Qiagen)提取血液样本的全基因组DNA。双生子的一致性通过19个STR位点进行检验。基因组DNA采用Me DIP测序技术分析全基因组甲基化谱。应用Off-Line Basecaller software(OLB V1.8)进行图像分析和测序峰图的读取。经过Solexa CHASTITY质量筛选器的筛选后,用BOWIE软件(V2.1.0)将reads与人类基因组(UCSC HG19)进行比对,可唯一比对的序列信息用于后续标准信息分析及个性化分析。Me DIP score用每千碱基含有的reads数作表示,小于8.31 reads/kb者定义为未甲基化,大于374.44 reads/kb者定义为完全甲基化,二者之间为部分甲基化。结果:1全基因组甲基化状态分布1.1 Cp G岛(CGI)区域甲基化状态在27841个CGI区域,8个样本的部分甲基化、完全甲基化及未甲基化的区域数分别为11324~18050、4189~5474及5164~11336,分别占总区域数的40.67%~64.83%、15.05%~19.66%及18.55%~40.72%。可见CGI区域完全甲基化状态所占比例最低,大多处于部分甲基化或未甲基化状态。其中启动子区CGI完全甲基化所占比例最低,仅为1%~2%左右,未甲基化所占比例最高,达30%~60%,反映启动子区CGI甲基化程度较低;而基因内CGI完全甲基化所占比例达35%~45%左右,甲基化程度较高;基因间区CGI甲基化程度介于二者之间。1.2启动子区域甲基化状态在29402个启动子区中,部分甲基化、完全甲基化及未甲基化的区域数分别为17213~22432、69~265及6880~11924,分别占总区域数的58.54%~76.29%、0.23%~0.90%及23.40%~40.56%。表明启动子区完全甲基化所占比例极低,接近于0,大多处于部分甲基化和未甲基化状态,甲基化程度较低。1.3 Genebody区域甲基化状态的分布在24157个Genebody区,部分甲基化、完全甲基化及未甲基化的区域数分别为17166~20850、33~85及3273~6917,分别占总区域数的71.06%~86.31%、0.14%~0.35%及13.55%~28.63%。表明genebody区完全甲基化所占比例极低,接近于0,大多处于部分甲基化和未甲基化状态,甲基化程度较低。2差异甲基化区域(DMR)分析2.1第一层筛选根据Me DIP评分的倍数FC≥2.0,选出每对双生子间的差异甲基化区域,4对MZT个体之间存在的DMR总数分别为22889、21239、17926、25140。其中大多分布在CGI区,其次为启动子区,Genebody区最少。进一步分析DMR在CGI不同区域的分布情况,发现MZT之间CGI中的DMR以启动子区CGI分布最多、其次为基因间区CGI、基因内区CGI最少。2.2第二层筛选为进一步筛选出甲基化程度差异最大区域,我们进行了第二层筛选,筛选条件为:1)Me DIP评分的倍数FC=100,2)其中一个样本的Me DIP评分>8.31。根据上述条件筛选出的区域在一个样本的甲基化状态为未甲基化,另一个样本为部分甲基化或完全甲基化,我们称之为主要DMR(major DMR,MDMR)。据此在4对MZT个体之间分别筛选出3766、2711、1772、2387个MDMR,其中大多仍分布在CGI区,其次为启动子区,Genebody区最少。进一步分析MDMR在CGI不同区域的分布情况,发现MZT之间CGI中的MDMR以启动子区CGI分布最多,其次为基因间区CGI,基因内区CGI最少。2.3四对MZT共存的MDMR在上述第二层筛选系统中,选出4对MZT共存的MDMR共38条序列,均分布在CGI,其中基因间区CGI 17条、启动子区CGI 17条、基因内区CGI4条。其中涉及到的基因有关序列主要有与细胞增值分化及生长发育密切相关的锌指蛋白基因及PRRX2基因、RBBP9基因,以及参与G蛋白信号调节的G蛋白信号调节子16基因等。结论:1本研究应用Me DIP测序技术分析4对MZT,从全基因组范围内筛选用于鉴别MZT个体的DNA甲基化遗传标记,发现在表型一致的MZT个体之间存在大量DMRs,在CGI、启动子区及Genebody区均有分布,以CGI区分布最多,且多分布于启动子区CGI,基因内DMRs分布最少。2从上述DMRs中进一步筛选出1772~3766个差异最大的主要DMR(MDMRs),并确定了38个MDMR为4对MZT共有,包括基因间区CGI 17个、启动子区CGI 17个、基因内区CGI 4个,多为与细胞分化及生长发育相关的基因,作为鉴别MZT的候选序列。