论文部分内容阅读
减数分裂重组是DNA重组的一类,是真核细胞减数分裂过程中同源染色体的非姊妹染色单体之间通过形成交叉而发生遗传信息交换的现象。重组并非在整个基因组上均匀发生,而是频繁发生在一些小范围区域,我们称之为重组热点;而在另一些区域不容易发生重组,我们称之为重组冷点。真核基因组的80%左右均被核小体所占据,其在基因组上的组装方式及其动态变化直接影响蛋白因子与基因组DNA的接触机遇,从而对DNA复制、转录和重组等生物学过程起到重要的作用。因此重组的发生不仅依赖于DNA序列,还依赖于染色质结构。准确地鉴定和描述重组热点和冷点,对于认识重组发生的分子机制以及基因组进化规律具有重要意义。用实验的方法获得高分辨率的重组率数据会耗费大量的时间和金钱,因此用理论的方法对重组率进行高分辨率预测是获得基因组水平精细重组率图谱的重要手段。本研究包括以下内容: 一、分析了酵母中重组频率与核小体占据率的相关性,并以4-mer频数和核小体占据率为特征参数,用IDQD算法对重组冷热点进行了预测。结果显示,基因组范围内酵母的重组频率与核小体占据率显著正相关(R=0.151,P<0.001),并且二者在编码区和基因间区域均显著正相关,表明核小体占据率高的区域更容易发生重组。以序列信息作为特征参数进行预测时,预测精度为80%,在特征参数中增加核小体占据率时,预测精度提高到81.6%,表明除DNA序列外,染色质结构也是影响重组频率的一个重要因素,同时从预测过程可以看出kilo-base尺度上的核小体占据率数据对于重组有着重要的影响。 二、用自己的方法重新定义重组热点和冷点序列,将二核苷酸偏好性、GC含量、Gibbs自由能、结构参数、四核苷酸频数以及核小体占据率作为特征参数,采用IDQD算法和SVM算法,对重组冷热点进行一系列的预测。结果发现,重组对DNA序列和染色质结构有着比较明显的依赖性,而将四核苷酸频数、自由能和核小体占据率作为特征参数进行预测时,预测效果最佳,预测精度为76%左右,这一现象表明对重组频率进行预测时,将序列特征和结构特征结合起来的预测效果要优于仅依靠某一种序列特征或者结构特征的预测。我们的数据表明,虽然SVM算法的预测精度略高于IDQD算法,但其敏感性非常低,说明就重组热点的预测而言,IDQD算法优于SVM算法。