论文部分内容阅读
核小体是真核生物染色质结构的重要组成单元,涉及到与DNA相关的各个生物学功能,如DNA的转录调控、复制与修复。核小体的精确定位是核小体行使其生物学功能的关键,核小体定位受到诸多因素的影响,诸如染色质重塑因子、DNA结合蛋白、核小体对DNA序列使用的偏好性等。随着染色质免疫共沉淀技术与芯片的结合(ChIP-chip)、染色质免疫共沉淀技术与第二代测序技术的结合(ChIP-seq)技术的发展,目前已经获得了多个物种精确的核小体定位图谱。核小体的结构在所有的真核生物中是保守的,一个核小体单位一般是由一段长为147bp的核心DNA序列缠绕在组蛋白八聚体上形成的,且组蛋白八聚体的结构在不同物种中也是保守的。不过不同物种的基因组组成背景是存在差异的,序列偏好又是决定核小体定位的重要因素之一,而核小体的核心定位序列是否像基因组序列一样存在协同进化还不清楚。另外,核小体的特异性分布重要集中在基因的转了起始区域,转录起始位点周围核小体的特性也是研究的热点,但是如何定义±1核小体以及在理论上找出可靠的NFR区域是需要仔细研究的,同时TSS上下游核小体的分布特征、NFR的序列结构与基因表达水平的关系也待进一步讨论。依赖于核小体的转录调控机制是十分复杂的,核小体参与的基因转录调控网络还需不断完善。因此,本文基于酿酒酵母、裂殖酵母、果蝇的单碱基精度的核小体定位图谱从三个方面进行了探讨,首先,对三个物种的核小体核心序列完成了核小体序列使用做了进化分析;其次,以酿酒酵母为样本,系统分析了其基因周围核小体的分布特征及其与基因表达之间的关系;最后,通过三个物种基因周围的±1核小体序列特征的分析,探讨了不同物种中基于核小体的基因表达调控机制的差异。(1)在核小体序列使用的进化分析中,通过新对称相对熵及序列模体使用特征参数的方法对酿酒酵母、裂殖酵母、果蝇的核心核小体序列做了分析。通过比较不同物种中不同k-mer信息所产生的新对称信息熵,结果显示,不同物种核小体的序列使用是存在差异的,而这些差异主要体现在核小体序列的中心区域附近,单碱基(1-mer)对核小体序列的序结构特征做出了主要的贡献,核小体对于序列的依赖强度为:果蝇>裂殖酵母>酿酒酵母。新对称信息熵对于不同物种中核小体序列的分析证明了核小体序列使用也是存在协同进化关系的。对于核小体序列碱基使用的分析发现,无论在哪个生物中,其核小体核心序列中都存在两个特殊的位点:一个位点富含碱基A缺少碱基T,另一个恰恰相反,富含碱基T缺少碱基A。进一步的研究发现,新对称信息熵的熵值分布峰的形成是由碱基A、T的使用差异造成的,而熵值的高低与k-mer中碱基A、T的含量具有很好的相关性,这在三个物种中也是极为保守的。为了进一步分析核小体序列的模体使用差异,我们使用分别基于CG0、CG1和CG2构建的序列模体特征参数对三个物种的核小体序列进行了分析,结果显示,CG1的模体是构成核小体序列的骨架,这类模体的使用在各个物种的核小体中是相对稳定且保守的;CGO和CG2是调节核小体特征的因素,核小体序列的模体使用差异来源于这两类模体。(2)在基因转录起始位点周围核小体的分布特征研究中,基于酿酒酵母全基因组单碱基精度的核小体定位图谱,以TSS和TTS为参考位置定义±1核小体,统计核小体的位置分布。结果显示相对于随机位置周围核小体的分布,TSS下游核小体的位置具有显著的保守性,呈明显双峰分布,在TSS上游和TTS两侧核小体的位置分布与随机位点两侧的核小体位置分布基本相同,对TSS两侧的核小体位置分布进一步分析,按照±1核小体距TSS的远近可将核小体分布分为两种固定模式。不过这种核小体位置的划分方式并不能给出明确的NFR。而后,我们对±1核小体进行重定义,将占据在TSS上或距TSS最近的核小体定义为+1核小体,并分析了核小体的位置分布。结果显示核小体位置均呈现单峰分布,同时发现核小体分布同样可以分为两种模式:具有明显NFR的核小体分布及无明显NFR的核小体分布。在具有明显NFR的核小体分布中,讨论了 TSS位点与NFR之间的位置关系,NFR中心一般位于TSS上游50-150bp的范围内,使用D2值的方法分析了 NFR的序列特征,发现NFR序列相对于其它核小体间的连接序列具有更强的序结构。最后研究了具有明显NFR基因的基因表达水平与核小体位置分布及NFR序结构的相关性,发现NFR下游随着基因表达水平的提高核小体的位置更为保守,NFR上游核小体的位置更为自由,且基因表达水平与NFR区域的长度及其序结构的强度呈正相关。(3)在基于核小体的转录表达调控机制的研究中,首先通过新对称相对熵的方法对酿酒酵母、裂殖酵母、果蝇基因周围的核小体序列做了分析。结果显示,酿酒酵母±1核小体的序列特征是有别于其他两个物种的,这种差异主要体现在两个方面:①酿酒酵母±1核小体在靠近TSS的一侧具有很高的熵值,而其他两个物种±1核小体不具有这种特征。②裂殖酵母和果蝇的±1核小体熵值分布的峰仍是由碱基A、T的使用差异造成的,而酿酒酵母±1核小体熵值分布的峰也掺杂了碱基C、G使用差异的因素。通过序列模体使用特征参数的方法对±1核小体序列的分析,结果显示,酿酒酵母基于核小体的转录调控机制同样有别于其他两个物种,裂殖酵母和果蝇趋向于多核小体共同参与转录调控,而在酿酒酵母中更趋向于通过±1核小体的滑动来调控基因转录。通过对酿酒酵母中具有不同长度核小体缺失区域的基因及不同表达水平基因的±1核小体的分析,CGO模体信息构建的核小体序列模体使用特征参数分布可以很好的反映出核小体的序列势能差,而这种序列势能差又可以很好的反映出核小体的滑动趋势。